Python做简单的字符串匹配详解

yipeiwu_com5年前Python基础

Python做简单的字符串匹配详解

 由于需要在半结构化的文本数据中提取一些特定格式的字段、数据辅助挖掘分析工作,以往都是使用Matlab工具进行结构化数据处理的建模,matlab擅长矩阵处理、结构化数据的计算,Python具有与matlab共同的特点:语法简洁、库丰富,对算法仿真来说都是一门简洁易用的语言。

Python做字符串匹配相对来说上手比较容易,且具有成熟的字符串处理库re供我们使用;

在re库的帮助下,只需简单的两步就可完成匹配工作,对做数据分析/算法的工作者来说,轻松了许多:

step1:构建正则表达式模式,并使用compile()函数生产正则表达式对象

step2:调用step1生成的正在表达式对象的方法、属性,返回匹配结果

<span style="color:#333300;"># 导入正则表达式匹配模块 Py 3.0 
import re 
text = "today is 01/04/2015, happy new year..." 
 
#建立日期的正则表达式 
detepat = re.compile('(\d+)/(\d+)/(\d+)') 
 
#进行匹配并打印结果 
result = detepat.finditer(text) 
for m in result: 
  print(m.group())</span> 

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

相关文章

python fabric实现远程操作和部署示例

近期接手越来越多的东西,发布和运维的工作相当机械,加上频率还蛮高,导致时间浪费还是优点多。修复bug什么的,测试,提交版本库(2分钟),ssh到测试环境pull部署(2分钟),rsync...

python读文件逐行处理的示例代码分享

复制代码 代码如下:import os ## for os.path.isfile() def dealline(line) :    print(line...

梅尔倒谱系数(MFCC)实现

本文实例为大家分享了梅尔倒谱系数实现代码,供大家参考,具体内容如下 """ @author: zoutai @file: mymfcc.py @time: 2018/03/26...

解决python3 HTMLTestRunner测试报告中文乱码的问题

使用HTMLTestRunner输出的测试报告中,标题和错误说明的中文乱码。 环境: python v3.6 HTMLTestRunner v0.8.2 定位问题 刚开始以为是pytho...

Python facenet进行人脸识别测试过程解析

Python facenet进行人脸识别测试过程解析

1.简介:facenet 是基于 TensorFlow 的人脸识别开源库,有兴趣的同学可以扒扒源代码: https://github.com/davidsandberg/facenet...