python处理两种分隔符的数据集方法

yipeiwu_com6年前Python基础

在做机器学习的时候,遇到这样一个数据集...

一共399行10列,

1-9列是用不定长度的空格分割,

第9-10列之间用'\t'分割,

前九列都是数值类型,其中第三列有若干个'?'填充的缺失值...

第十列是字符串类型,..

部分数据截图:

python处理分隔符的数据集

之前我是用python强写的...很麻烦,代码如下:

python处理分隔符的数据集

python处理分隔符的数据集

至此,可以已平均值,填充缺失值...

今天再回顾此数据库;决定用pandas库来试试;

1,导包,用pandas.read_table导入数据集,

python处理分隔符的数据集

2,数据处理

python处理分隔符的数据集

最后输出如下:

python处理分隔符的数据集

以上这篇python处理两种分隔符的数据集方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python实现Dijkstra静态寻路算法

python实现Dijkstra静态寻路算法

算法介绍 迪科斯彻算法使用了广度优先搜索解决赋权有向图或者无向图的单源最短路径问题,算法最终得到一个最短路径树。该算法常用于路由算法或者作为其他图算法的一个子模块。 当然目前也有人将它用...

Python 读取图片文件为矩阵和保存矩阵为图片的方法

读取图片为矩阵 import matplotlib im = matplotlib.image.imread('0_0.jpg') 保存矩阵为图片 import numpy a...

基于django ManyToMany 使用的注意事项详解

使用场景一: 如果在一张表中ManayTOManay字段关联的是自身,也就是出项这样的代码: ManyToManyField(self) 那么,你需要注意一点,当你采用add方法将一个自...

Django多数据库的实现过程详解

有些项目可能涉及到使用多个数据库的情况,方法很简单。 1.在settings中设定DATABASE 比如要使用两个数据库: DATABASES = { 'default': {...

Python2.x版本中maketrans()方法的使用介绍

 maketrans()方法返回的字符串intab每个字符映射到字符的字符串outtab相同位置的转换表。然后这个表被传递到translate()函数。 注意:两个intab和...