python针对不定分隔符切割提取字符串的方法

yipeiwu_com5年前Python基础

问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如:

原字符串如下:

'asd ff gg; asd , foo| og '

我们需要删除上面的,;|分隔符和多余空格,提取出:

['asd', 'ff', 'gg', 'asd', 'foo', 'og']

这种一般用于处理日志或者网页数据提取,一般而言,这种数据中需要的数据分布规律性不是太强,而且比较散。

处理结果如下:

import re
line = 'asd ff gg; asd , foo| og '
data = re.split(r'[;,|\s]\s*',line)
for i in data:
 if i == '':
 data.remove(i)
print(data)

以上这篇python针对不定分隔符切割提取字符串的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

跟老齐学Python之做一个小游戏

在讲述有关list的时候,提到做游戏的事情,后来这个事情一直没有接续。不是忘记了,是在想在哪个阶段做最合适。经过一段时间学习,看官已经不是纯粹小白了,已经属于python初级者了。现在就...

Python 删除连续出现的指定字符的实例

源起 我本想删写一小段代码用于删除一串字符串中的连续重复的指定字符,可能也是长时间不写代码,而且有的时候写代码只途快,很多基础知识都忘光了。我用Python写时一切都没有问题,就差一点,...

python-opencv 将连续图片写成视频格式的方法

如下所示: import cv2 import os #图片路径 im_dir = '/home/suanfa/data/out/201708231503440' #输出视频路径...

Python使用PDFMiner解析PDF代码实例

Python使用PDFMiner解析PDF代码实例

近期在做爬虫时有时会遇到网站只提供pdf的情况,这样就不能使用scrapy直接抓取页面内容了,只能通过解析PDF的方式处理,目前的解决方案大致只有pyPDF和PDFMiner。因为据说P...

Python的Twisted框架中使用Deferred对象来管理回调函数

Python的Twisted框架中使用Deferred对象来管理回调函数

首先抛出我们在讨论使用回调编程时的一些观点: 激活errback是非常重要的。由于errback的功能与except块相同,因此用户需要确保它们的存在。他们并不是可选项,而是必选项...