python截取两个单词之间的内容方法

yipeiwu_com6年前Python基础

1. __init__ 初始化文件路径,关键字1,关键字2;

2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式);

3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件)。

#!/usr/bin/python3
# -*- coding: utf-8 -*-
 
import re
 
#文本所在路径,引号前加r指按路径处理
#关键字word1,word2,换关键字,需修改引号间的内容
 
class match2Words(object):
 lines=0
 def __init__(self,path,word1,word2):
  self.path = path
  self.word1 = word1
  self.word2 = word2
 def key_match(self):
  with open(self.path,'rb') as f:
   buffer = f.read()
   pattern = re.compile(self.word1+b'(.*?)'+self.word2,re.S)
   result = pattern.findall(buffer)
   if result != []:
    print(result)
    #self.lines +=1
    #print("匹配到的行数:",self.lines)
   else:
    print("没有找到你输入的关键字")
 
path = input("请输入要分析的log地址:")
word1 = b"begin"
word2 = b"end"
matchWords = match2Words(path, word1, word2)
matchWords.key_match()

以上这篇python截取两个单词之间的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Flask配置Cors跨域的实现

Flask配置Cors跨域的实现

1 跨域的理解 跨域是指:浏览器A从服务器B获取的静态资源,包括Html、Css、Js,然后在Js中通过Ajax访问C服务器的静态资源或请求。即:浏览器A从B服务器拿的资源,资源中想访...

Django logging配置及使用详解

1. settings.py文件 做开发离不开必定离不开日志, 以下是我在工作中写Django项目常用的logging配置. # 日志配置 BASE_LOG_DIR = os.pa...

windows及linux环境下永久修改pip镜像源的方法

windows及linux环境下永久修改pip镜像源的方法

一、在windows环境下修改pip镜像源的方法(以python3.5为例) (1):在windows文件管理器中,输入 %APPDATA% (2):会定位到一个新的目录下,在该目...

pyqt4教程之实现半透明的天气预报界面示例

复制代码 代码如下:# -*- coding: cp936 -*-import sysimport urllib2import jsonfrom PyQt4 import QtCore,...

浅谈Python在pycharm中的调试(debug)

浅谈Python在pycharm中的调试(debug)

作为一名程序员,调试(debug)程序是一项必会的事情,在利用pycharm这个pythonIDE时,不好好利用其调试功能真的是太可惜了。 借用这两天学习机器学习的工程。 在Deep_...