python针对不定分隔符切割提取字符串的方法

yipeiwu_com6年前Python基础

问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如:

原字符串如下:

'asd ff gg; asd , foo| og '

我们需要删除上面的,;|分隔符和多余空格,提取出:

['asd', 'ff', 'gg', 'asd', 'foo', 'og']

这种一般用于处理日志或者网页数据提取,一般而言,这种数据中需要的数据分布规律性不是太强,而且比较散。

处理结果如下:

import re
line = 'asd ff gg; asd , foo| og '
data = re.split(r'[;,|\s]\s*',line)
for i in data:
 if i == '':
 data.remove(i)
print(data)

以上这篇python针对不定分隔符切割提取字符串的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python实现报表自动化详解

python实现报表自动化详解

本篇文章将介绍: xlwt 常用功能 xlrd 常用功能 xlutils 常用功能 xlwt写Excel时公式的应用 xlwt写入特定目录(路径设置) xlwt Python语言中,写...

Python的装饰器使用详解

Python有大量强大又贴心的特性,如果要列个最受欢迎排行榜,那么装饰器绝对会在其中。 初识装饰器,会感觉到优雅且神奇,想亲手实现时却总有距离感,就像深闺的冰美人一般。这往往是因为理解装...

python开头的coding设置方法

缘起: [root@CentOS7 code]# python multi_thread_mfw.py File "multi_thread_mfw.py", line 138...

python获取本地计算机名字的方法

本文实例讲述了python获取本地计算机名字的方法。分享给大家供大家参考。具体如下: import sys, socket hostname = socket.gethostname...

python高手之路python处理excel文件(方法汇总)

python高手之路python处理excel文件(方法汇总)

用python来自动生成excel数据文件。python处理excel文件主要是第三方模块库xlrd、xlwt、xluntils和pyExcelerator,除此之外,python处理e...