宜配屋

python删除文本中行数标签的方法

yipeiwu_com6年前 (2020-03-06)Python基础

问题描述：

我们在网上下载或者复制别人代码的时候经常会遇到下载的代码中包含行数标签的情况。如下图：

这些代码中包含着行数如1.，2.等，如果我们想直接运行或者copy代码需要自己手动的删除这些标签。既然学了python，我们写一段脚本来处理它吧。

思路分析：

首先，我们逐行的读取文本。

利用正则表达式，可以顺利地匹配出所有的这些标签以及后面跟随的“\t”，正则表达式为：“\d+.\t”。

接着我们将匹配的结果在这一行中删除它，使用string模块的replace方法，将匹配的结果用‘'代替。

最后，我们保存每次删除了行数标签的结果行，然后将这些行写入原文本。注意，以w的方式打开文本会删除原文本内容。

代码：

# -*- coding:utf-8 -*- 
import re 
import os 
import sys 
reload(sys) 
sys.setdefaultencoding('utf-8') 
 
ls = os.linesep 
label_regex = r'\d+.\t' 
content = [] 
for line in open('source.txt', 'r'): 
  mm = re.search(label_regex, line) 
  if mm: 
    mm = mm.group() 
    content.append(line.replace(mm, '').rstrip()) 
  else: 
    break 
f = open('source.txt', 'w') 
f.writelines(['%s%s' % (x,ls) for x in content])

结果：

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持【听图阁-专注于Python设计】。

python删除文本中行数标签的方法

相关文章

Python cookbook(数据结构与算法)实现对不原生支持比较操作的对象排序算法示例

Python数据类型之String字符串实例详解

Python实现九宫格式的朋友圈功能内附“马云”朋友圈

python利用itertools生成密码字典并多线程撞库破解rar密码

Python中new方法的详解

© YiPeiWu.com 【宜配屋】粤ICP备17031333号

Powered By Z-BlogPHP. Theme by TOYEAN.

宜配屋

python删除文本中行数标签的方法

相关文章

Python cookbook(数据结构与算法)实现对不原生支持比较操作的对象排序算法示例

Python数据类型之String字符串实例详解

Python实现九宫格式的朋友圈功能内附“马云”朋友圈

python利用itertools生成密码字典并多线程撞库破解rar密码

Python中new方法的详解

© YiPeiWu.com 【宜配屋】 粤ICP备17031333号 var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?8aa60ae04b767b2af31903508928acc0"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

© YiPeiWu.com 【宜配屋】粤ICP备17031333号