python处理两种分隔符的数据集方法

yipeiwu_com6年前Python基础

在做机器学习的时候,遇到这样一个数据集...

一共399行10列,

1-9列是用不定长度的空格分割,

第9-10列之间用'\t'分割,

前九列都是数值类型,其中第三列有若干个'?'填充的缺失值...

第十列是字符串类型,..

部分数据截图:

python处理分隔符的数据集

之前我是用python强写的...很麻烦,代码如下:

python处理分隔符的数据集

python处理分隔符的数据集

至此,可以已平均值,填充缺失值...

今天再回顾此数据库;决定用pandas库来试试;

1,导包,用pandas.read_table导入数据集,

python处理分隔符的数据集

2,数据处理

python处理分隔符的数据集

最后输出如下:

python处理分隔符的数据集

以上这篇python处理两种分隔符的数据集方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

NetworkX之Prim算法(实例讲解)

NetworkX之Prim算法(实例讲解)

引言 Prim算法与Dijkstra的最短路径算法类似,它采用贪心策略。算法开始先把图中权值最小的边添加到树T中,然后不断把权值最小的边E(E的一个端点在T中,另一个在G-T中)。当没有...

python+django+rest框架配置创建方法

python+django+rest框架配置创建方法

安装好所需要的插件和包: python、django、pip等版本如下: 采用Django REST框架3.0 1、在python文件夹下D:\python\Lib\site-pack...

python随机在一张图像上截取任意大小图片的方法

如下所示: ''' 机器学习中随机产生负样本的 ''' import cv2 import random #读取图片 img=cv2.imread('1.png') #h...

python对象销毁实例(垃圾回收)

我就废话不多说了,直接上代码吧! '''python对象销毁(垃圾回收)''' class Point: 'info class' def __init__(self,x...

Python使用random和tertools模块解一些经典概率问题

random 模块中的常用函数 复制代码 代码如下: random() 返回一个位于区间 [0,1] 内的实数; uniform(a, b) 返回一个位于区间 [a,b] 内的实数; r...