python针对不定分隔符切割提取字符串的方法

yipeiwu_com6年前Python基础

问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如:

原字符串如下:

'asd ff gg; asd , foo| og '

我们需要删除上面的,;|分隔符和多余空格,提取出:

['asd', 'ff', 'gg', 'asd', 'foo', 'og']

这种一般用于处理日志或者网页数据提取,一般而言,这种数据中需要的数据分布规律性不是太强,而且比较散。

处理结果如下:

import re
line = 'asd ff gg; asd , foo| og '
data = re.split(r'[;,|\s]\s*',line)
for i in data:
 if i == '':
 data.remove(i)
print(data)

以上这篇python针对不定分隔符切割提取字符串的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python 内置函数filter

python 内置函数filter class filter(object): """ filter(function or None, iterable) --> fil...

跟老齐学Python之用while来循环

跟老齐学Python之用while来循环

在python中,它也有这个含义,不过有点区别的是,“当...时候”这个条件成立在一段范围或者时间间隔内,从而在这段时间间隔内让python做好多事情。就好比这样一段情景: while...

python多线程同步实例教程

python多线程同步实例教程

前言 进程之间通信与线程同步是一个历久弥新的话题,对编程稍有了解应该都知道,但是细说又说不清。一方面除了工作中可能用的比较少,另一方面就是这些概念牵涉到的东西比较多,而且相对较深。网络编...

Python标准库之随机数 (math包、random包)介绍

我们已经在Python运算中看到Python最基本的数学运算功能。此外,math包补充了更多的函数。当然,如果想要更加高级的数学功能,可以考虑选择标准库之外的numpy和scipy项目,...

pandas 读取各种格式文件的方法

pandas 读取各种格式文件: 前置工序: import pandas as pd csv 文件读取中文错误处理: utf-8 codec can't decode .... pd...