Python做简单的字符串匹配详解

yipeiwu_com5年前Python基础

Python做简单的字符串匹配详解

 由于需要在半结构化的文本数据中提取一些特定格式的字段、数据辅助挖掘分析工作,以往都是使用Matlab工具进行结构化数据处理的建模,matlab擅长矩阵处理、结构化数据的计算,Python具有与matlab共同的特点:语法简洁、库丰富,对算法仿真来说都是一门简洁易用的语言。

Python做字符串匹配相对来说上手比较容易,且具有成熟的字符串处理库re供我们使用;

在re库的帮助下,只需简单的两步就可完成匹配工作,对做数据分析/算法的工作者来说,轻松了许多:

step1:构建正则表达式模式,并使用compile()函数生产正则表达式对象

step2:调用step1生成的正在表达式对象的方法、属性,返回匹配结果

<span style="color:#333300;"># 导入正则表达式匹配模块 Py 3.0 
import re 
text = "today is 01/04/2015, happy new year..." 
 
#建立日期的正则表达式 
detepat = re.compile('(\d+)/(\d+)/(\d+)') 
 
#进行匹配并打印结果 
result = detepat.finditer(text) 
for m in result: 
  print(m.group())</span> 

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

相关文章

使用wxPython获取系统剪贴板中的数据的教程

涉及到开发桌面程序,尤其是文本处理,剪贴板就很常用,不像 java 中那么烦锁,wxpython 中访问剪贴板非常简单,寥寥几句足以。 # 取得剪贴板并确保其为打开状态 text_o...

Python实现图片批量加入水印代码实例

Python实现图片批量加入水印代码实例

这篇文章主要介绍了Python实现图片批量加入水印代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 写文章的时候可以设置是否添加...

Python中的生成器和yield详细介绍

列表推导与生成器表达式 当我们创建了一个列表的时候,就创建了一个可以迭代的对象: 复制代码 代码如下: >>> squares=[n*n for n in range(...

python使用range函数计算一组数和的方法

本文实例讲述了python使用range函数计算一组数和的方法。分享给大家供大家参考。具体如下: sum = 0 numbers = range(1,10) for i in num...

python实现去除下载电影和电视剧文件名中的多余字符的方法

python实现去除下载电影和电视剧文件名中的多余字符的方法

本文实例讲述了python实现去除下载电影和电视剧文件名中的多余字符的方法,是一个非常实用的技巧,分享给大家供大家参考。具体如下: 有时候我们讨厌下载电影和电视剧文件名中的多余字符(如网...