Python统计文件中去重后uuid个数的方法

yipeiwu_com5年前Python基础

本文实例讲述了Python统计文件中去重后uuid个数的方法。分享给大家供大家参考。具体如下:

利用正则表达式按行获取日志文件中的的uuid,并且统计这些uuid的去重个数(去重利用set)

import re
pattern=re.compile(r'&uuid=.*&')
uuidset=set()
with open('request.log.2015-05-26','rt') as f:
    for line in f:
        all=pattern.findall(line)
        if len(all)>0 and line.find('iphone')>0:
            # print(all[0])
            uuidset.add(all[0])
print(len(uuidset))

希望本文所述对大家的Python程序设计有所帮助。

相关文章

为什么Python中没有"a++"这种写法

一开始学习 Python 的时候习惯性的使用 C 中的 a++ 这种写法,发现会报 SyntaxError: invalid syntax 错误,为什么 Python 没有自增运算符的这...

pandas 条件搜索返回列表的方法

pandas中常用的一件事情就是对特定条件进行搜索,那么这里介绍使用pandas搜索方式,本案例使用的pandas是anaconda中的,可以下载任意的anaconda进行安装都会带有。...

Python处理时间日期坐标轴过程详解

Python处理时间日期坐标轴过程详解

1. 前言 当日期数据作为图表的坐标轴时通常需要特殊处理,应为日期字符串比较长,容易产生重叠现象 2. 设定主/次刻度 2.1 引用库 from matplotlib.date...

Python3.4 splinter(模拟填写表单)使用方法

如下所示: from splinter.browser import Browser b = Browser('chrome') url = 'https://kyfw.12...

Python实现比较两个文件夹中代码变化的方法

本文实例讲述了Python实现比较两个文件夹中代码变化的方法。分享给大家供大家参考。具体如下: 这里将修改代码后的目录与原始目录做对比,罗列出新增的代码文件,以及修改过的代码文件 #...