Python判断文本中消息重复次数的方法

yipeiwu_com5年前Python基础

本文实例讲述了Python判断文本中消息重复次数的方法。分享给大家供大家参考,具体如下:

#coding:gbk
'''
Created on 2012-2-3
从文件中读取文本,并判断文本中形如“message0”、“message123”这样的消息有多少条是重复的
@author: Administrator
'''
import re
if __name__ == '__main__':
  pattern = u"(message((\d)+))"
  prog = re.compile(pattern)
  # read text from file
  f = open("1003.txt","r")
  text = unicode(f.read())
  f.close()
  result = prog.findall(text)
  message_map = dict()
  redupicate_count = 0
  for message in result:
    if message_map.has_key(message[0]) == True:
      print message[0], "is reduplicate"
      redupicate_count += 1
    else :
      message_map[message[0]] = 1;
  print "total reduplicate message is ", redupicate_count

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python数据结构与算法教程》、《Python Socket编程技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总

希望本文所述对大家Python程序设计有所帮助。

相关文章

Python中利用xpath解析HTML的方法

在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也能分析html结构), 利用其lxml.html的xpath对h...

python3 flask实现文件上传功能

本文实例为大家分享了python3-flask文件上传操作的具体代码,供大家参考,具体内容如下 # -*- coding: utf-8 -*- import os import uu...

解决pandas展示数据输出时列名不能对齐的问题

列名用了中文的缘故,设置pandas的参数即可, 代码如下: import pandas as pd #这两个参数的默认设置都是False pd.set_option('dis...

Python基于OpenCV实现人脸检测并保存

本文实例为大家分享了Python基于OpenCV实现人脸检测,并保存的具体代码,供大家参考,具体内容如下 安装opencv 如果安装了pip的话,Opencv的在windows的安装可以...

python 除法保留两位小数点的方法

如下所示: a = 1 b = 3 print(a/b) #方法一: print(round(a/b,2)) #方法二: print(format(float(a)/float(b)...