pandas 如何分割字符的实现方法

yipeiwu_com6年前Python基础

摘要:本文主要是在pandas中如何对字符串进行切分。我们考虑一下下面的应用场景。


这个是我们的数据集(data),可以看到,数据集中某一列(name)是某个行业的分类。各个行业之间用符号 ‘|'分割。我们要把用每个‘|'进行分割的内容抽取出来。pandas有个一步到到位的方法,非常方便。

import pandas as pd
data['name'].str.split('|',expand=True)

关键是参数expand,这个参数取True时,会把切割出来的内容当做一列。 如果不需要pandas为你分好列,expand=False就可以了。通过上面一步,我们可以得到下面的结果。


这个时候已经切成3列了。

然后,我们如果只想要第一列的话,只需要做:

data['name'].str.split('|',expand=True)[0]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

给Python中的MySQLdb模块添加超时功能的教程

使用Python操作MySQL数据库的时候常使用MySQLdb这个模块。 今天在开发的过程发现MySQLdb.connect有些参数没法设置。通过这个页面我们可以看到在connect的时...

python之yield表达式学习

python中有一个略微奇怪的表达式叫yield expression,本文就来探究一下这是个什么东西。一步一步来。 iterable 复制代码 代码如下: mylist = [1,2,...

Pytorch之view及view_as使用详解

view()函数是在torch.Tensor.view()下的一个函数,可以有tensor调用,也可以有variable调用。 其作用在于返回和原tensor数据个数相同,但size不同...

python 计算积分图和haar特征的实例代码

下面的代码通过积分图计算一张图片的一种haar特征的所有可能的值。初步学习图像处理并尝试写代码,如有错误,欢迎指出。 import cv2 import numpy as np im...

Python开发的单词频率统计工具wordsworth使用方法

Python开发的单词频率统计工具wordsworth使用方法

使用方法: python wordsworth --filename textfile.txt python wordsworth -f textfile.txt 分析结果:...