使用pandas批量处理矢量化字符串的实例讲解

yipeiwu_com6年前Python基础

进行已经矢量化后的字符串数据,可以使用pandas的Series数据对象的map方法。这样,对于未经矢量化的数据也可以先进行数据的矢量化转换然后再进行相应的处理。

举例实现字符串数据的操作,编写代码如下:

#!/usr/bin/python
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
seriers_data = Series(['Hello','Python','Data','World'])
print(seriers_data.map(str.lower))

程序的运行结果如下:

GreydeMac-mini:chapter07 greyzhang$ vim series_map.py
GreydeMac-mini:chapter07 greyzhang$ python series_map.py 
0   hello
1  python
2   data
3   world
dtype: object

上面的例子中,先对列表形式的数据进行了向量化的处理,讲数据处理成pandas的Series对象类型,然后进行矢量化的操作。通过Series的map方法对每个字符串进行了全都转换成小写字母的操作。

以上这篇使用pandas批量处理矢量化字符串的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python time模块详解(常用函数实例讲解,非常好)

Python time模块详解(常用函数实例讲解,非常好)

在开始之前,首先要说明这几点: 1.在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时间字符串 3)元组(struct_time)共九个元素。由于Python的ti...

python 实现list或string按指定分段

我就废话不多说了,直接上代码吧! #方法一 def list_cut(mylist,count): length=len(mylist) merchant=length//c...

Python中对象迭代与反迭代的技巧总结

一、如何实现可迭代对象和迭代器对象? 实际案例 某软件要求从网络抓取各个城市气味信息,并其次显示: 北京: 15 ~ 20 天津: 17 ~ 22 长春: 12 ~ 18 .......

python字典多键值及重复键值的使用方法(详解)

python字典多键值及重复键值的使用方法(详解)

在Python中使用字典,格式如下: dict={ key1:value1 , key2;value2 ...} 在实际访问字典值时的使用格式如下: dict[key] 多...

pytorch 图像中的数据预处理和批标准化实例

目前数据预处理最常见的方法就是中心化和标准化。 中心化相当于修正数据的中心位置,实现方法非常简单,就是在每个特征维度上减去对应的均值,最后得到 0 均值的特征。 标准化也非常简单,在数据...