python提取具有某种特定字符串的行数据方法

yipeiwu_com5年前Python基础

今天又帮女朋友处理了一下,她的实验数据,因为python是一年前经常用,最近找工作,用的是c,c++,python的有些东西忘记了,然后就一直催我,说我弄的慢,弄的慢,你自己弄啊,烦不烦啊,逼逼叨叨的,最后还不是我给弄好的?呵呵

好的,数据是这样的,我截个图

python提取具有某种特定字符串的行数据

我用红括号括起来的,就是我所要提取的数据

其中lossstotal.txt是我要提取的原始数据,考虑两种方法去提取,前期以为所要提取行的数据是有一定规律的,后来发现,并不是,所以,我考虑用正则来提取,经过思考以后,完成了数据的提取,如下午所示,数据变的非常好看

python提取具有某种特定字符串的行数据

代码如下:

#coding:utf-8
#__author__ ='dell'

import re

f1=file('losstotal.txt','r')
data1=f1.readlines()
# print data1
f1.close()
results = []
f2 = open('loss2.txt', 'w')

# # 按照特定行提取,发现后面的行并无规律
# i = 0
# for line in data1:
# i+=1
# # print line
# if((i-1)%3==0):
# f2.write(line)
# print line


# 利用正则表达式

for line in data1:
 data2=line.split()
 # print data2
 for i in data2:
 n = re.findall(r"Iteration", i)
 # m=re.findall(r"loss", i)
 if n:
  # print line
  f2.writelines(line)
f2.close()


f3=file('loss2.txt','r')
data3=f3.readlines()
# print data1
f3.close()
f4 = open('loss3.txt', 'w')

for line in data3:
 data4=line.split()
 # print data2
 for i in data4:
 n = re.findall(r"loss", i)
 # m=re.findall(r"loss", i)
 if n:
  print line
  f4.writelines(line)
f4.close()


# 去掉逗号
f5=open('loss3.txt','r')
data5=f5.read()
f5=data5.replace(',',' ')
f6=file('lossfinal.txt','w')
f6.write(f5)
f6.close()

# # 去掉等号=
f7=open('lossfinal.txt','r')
data7=f7.read()
f7=data7.replace('=',' ')
f8=file('lossfinal.txt','w')
f8.write(f7)
f8.close()
  # data3=lin.split()
  # for j in data3:
  # m=re.findall(r"loss",i)
  # if m:
  # print lin

 # # m=re.findall(r"sgd_solver.cpp",i)
 # n=re.findall(r"Iteration",i)

我在同样的目录下,还建立了

python提取具有某种特定字符串的行数据

这几个txt文件,要不然,代码跑不通的哟。

解释:我连续用了两个正则,各自把含有特定字符串的行进行提取,两个写一起,发现还是不太会,所以分开写了,但是结果还是完成的不错!

以上这篇python提取具有某种特定字符串的行数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python实现汽车管理系统

本文实例为大家分享了python实现汽车管理系统的具体代码,供大家参考,具体内容如下 1、定义车辆类,属性有车牌号、颜色、车型(小汽车、小卡、中卡和大卡)、到达的时间和离开的时间等信息...

Python3获取电脑IP、主机名、Mac地址的方法示例

本文实例讲述了Python3获取电脑IP、主机名、Mac地址的方法。分享给大家供大家参考,具体如下: # -*- coding:utf-8 -*- #! python3 ''' Cr...

用Python生成器实现微线程编程的教程

微线程领域(至少在 Python 中)一直都是 Stackless Python 才能涉及的特殊增强部分。关于 Stackless 的话题以及最近它经历的变化,可能本身就值得开辟一个专栏...

pandas 两列时间相减换算为秒的方法

如下所示: pd.to_datetime(data[data['last_O_XLMC']==data['O_XLMC']]['O_SJFCSJ'], format='%H:%M:%...

Python求解正态分布置信区间教程

Python求解正态分布置信区间教程

正态分布和置信区间 正态分布(Normal Distribution)又叫高斯分布,是一种非常重要的概率分布。其概率密度函数的数学表达如下: 置信区间是对该区间能包含未知参数的可置信的...