使用pandas批量处理矢量化字符串的实例讲解

yipeiwu_com5年前Python基础

进行已经矢量化后的字符串数据,可以使用pandas的Series数据对象的map方法。这样,对于未经矢量化的数据也可以先进行数据的矢量化转换然后再进行相应的处理。

举例实现字符串数据的操作,编写代码如下:

#!/usr/bin/python
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
seriers_data = Series(['Hello','Python','Data','World'])
print(seriers_data.map(str.lower))

程序的运行结果如下:

GreydeMac-mini:chapter07 greyzhang$ vim series_map.py
GreydeMac-mini:chapter07 greyzhang$ python series_map.py 
0   hello
1  python
2   data
3   world
dtype: object

上面的例子中,先对列表形式的数据进行了向量化的处理,讲数据处理成pandas的Series对象类型,然后进行矢量化的操作。通过Series的map方法对每个字符串进行了全都转换成小写字母的操作。

以上这篇使用pandas批量处理矢量化字符串的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

解决python写入带有中文的字符到文件错误的问题

在python写脚本过程中需要将带有中文的字符串内容写入文件,出现了报错的现象。 ---------------------------- UnicodeEncodeError: 'as...

举例讲解Python中的身份运算符的使用方法

举例讲解Python中的身份运算符的使用方法

Python身份运算符 身份运算符用于比较两个对象的存储单元 以下实例演示了Python所有身份运算符的操作: #!/usr/bin/python a = 20 b = 20...

python的等深分箱实例

python的等深分箱实例

背景 当前很多文章尝试过最优分箱,python上也有cut等方法进行等宽分箱。为了方便日后输出结果以及分箱要求。做一个简单的轮子以供大家日后使用。很多能用其他轮子的地方也没有多余出力,也...

Python中read()、readline()和readlines()三者间的区别和用法

前言 众所周知在python中读取文件常用的三种方法:read(),readline(),readlines(),今天看项目是又忘记他们的区别了。以前看书的时候觉得这东西很简单,一眼扫过...

详解python-图像处理(映射变换)

详解python-图像处理(映射变换)

做计算机视觉方向,除了流行的各种深度学习算法,很多时候也要会基础的图像处理方法。 记录下opencv的一些操作(图像映射变换),日后可以方便使用 先上一张效果图 图二和图三是同一种方法...