python 去除txt文本中的空格、数字、特定字母等方法

yipeiwu_com5年前Python基础

使用场景:需要去除txt文本中的空格、数字、特定字母等。

需要修改的txt文本叫做:train.txt

修改之后保存成:train_output.txt

# ecoding=utf-8
ifn = r"train.txt"
ofn = r"train_output.txt"

infile = open(ifn,'rb')
outfile = open(ofn,'wb')

for eachline in infile.readlines():
  #去掉文本行里面的空格、\t、数字(其他有要去除的也可以放到' \t1234567890'里面)
  lines = filter(lambda ch: ch not in ' \t1234567890', eachline) 

  outfile.write(lines) # 写入train_output.txt(此处是一股脑的全写进去,并没有做任何的分行处理)

infile.close
outfile.close

以上这篇python 去除txt文本中的空格、数字、特定字母等方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python批量提取PDF文件中文本的脚本

本文实例为大家分享了Python批量提取PDF文件中文本的具体代码,供大家参考,具体内容如下 首先需要执行命令pip install pdfminer3k来安装处理PDF文件的扩展库。...

Python3实现发送QQ邮件功能(附件)

本文实例为大家分享了Python3实现发送QQ邮件功能:附件,供大家参考,具体内容如下 可以成功发送邮件附件,但是邮件主要内容无法发送,有空再去找找原因 import smtplib...

在Python中的Django框架中进行字符串翻译

使用函数 ugettext() 来指定一个翻译字符串。 作为惯例,使用短别名 _ 来引入这个函数以节省键入时间. 在下面这个例子中,文本 "Welcome to my site" 被标记...

Python实现批量转换文件编码的方法

本文实例讲述了Python实现批量转换文件编码的方法。分享给大家供大家参考。具体如下: 这里将某个目录下的所有文件从一种编码转换为另一种编码,然后保存 import os impor...

Numpy数组array和矩阵matrix转换方法

1、ndarray转换成matrix import numpy as np from numpy import random,mat r_arr=random.rand(4,4)...