pandas 如何分割字符的实现方法

yipeiwu_com5年前Python基础

摘要:本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。


这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|'分割。我们要把用每个‘|'进行分割的内容抽取出来。pandas有个一步到到位的方法,非常方便。

import pandas as pd
data['name'].str.split('|',expand=True)

关键是参数expand,这个参数取True时,会把切割出来的内容当做一列。 如果不需要pandas为你分好列,expand=False就可以了。通过上面一步,我们可以得到下面的结果。


这个时候已经切成3列了。

然后,我们如果只想要第一列的话,只需要做:

data['name'].str.split('|',expand=True)[0]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python3中的最大整数和最大浮点数实例

Python中的最大整数 Python中可以通过sys模块来得到int的最大值. python2中使用的方法是 import sys max = sys.maxint print (...

Pycharm 2020最新永久激活码(附最新激活码和插件)

Pycharm 2020最新永久激活码(附最新激活码和插件)

最近很多人的Pycharm激活时间又过期了,很多人索要激活码,我就再把激活的方法汇总和工具再梳理一次给大家。 最主要有两种激活方式(两种方式需要的激活码不同): Pycharm最新的激活...

Python 取numpy数组的某几行某几列方法

Python 取numpy数组的某几行某几列方法

直接分析,如原矩阵如下(1):   (1) 我们要截取的矩阵(取其一三行,和三四列数据构成矩阵)为如下(2):   (2) 错误分析: 取 C 的1 3行...

python获取指定字符串中重复模式最高的字符串方法

给定一个字符串,如何得到其中重复模式最高的子字符串,我采用的方法是使用滑窗机制,对给定的字符串切分,窗口的大小从1增加到字符串长度减1,将所有的得到的切片统计结果,在这里不考虑单个字符的...

Python应用库大全总结

学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。 Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 当我们在浏览器中输入一个url后回...