Python统计文件中去重后uuid个数的方法

yipeiwu_com6年前Python基础

本文实例讲述了Python统计文件中去重后uuid个数的方法。分享给大家供大家参考。具体如下:

利用正则表达式按行获取日志文件中的的uuid,并且统计这些uuid的去重个数(去重利用set)

import re
pattern=re.compile(r'&uuid=.*&')
uuidset=set()
with open('request.log.2015-05-26','rt') as f:
    for line in f:
        all=pattern.findall(line)
        if len(all)>0 and line.find('iphone')>0:
            # print(all[0])
            uuidset.add(all[0])
print(len(uuidset))

希望本文所述对大家的Python程序设计有所帮助。

相关文章

python fuzzywuzzy模块模糊字符串匹配详细用法

github主页 导入: >>> from fuzzywuzzy import fuzz >>> from fuzzywuzzy import p...

基于python 微信小程序之获取已存在模板消息列表

前言: 为了获取一定高级操作,如:微信模板消息(xiao,xin)推送,把消息推送给用户,或者是获取用户授权信息都需要用到access token,有效期为两个小时? 过了两个小时怎么办...

Django分页查询并返回jsons数据(中文乱码解决方法)

一、引子 Django 分页查询并返回 json ,需要将返回的 queryset 序列化, demo 如下: # coding=UTF-8 import os from dj...

VSCode下好用的Python插件及配置

VSCode下好用的Python插件及配置

MS Python插件。 这是微软官方的Python插件,已经自带很多功能。下面是插件功能描述,其中部分内容我做了翻译。 a)     ...

速记Python布尔值

在python中。布尔值有 Ture False 两种。Ture等于对,False等于错。要注意在python中对字母的大小写要求非常严格。 Ture 和 False 的首字母都要大写。...