python处理两种分隔符的数据集方法

yipeiwu_com6年前Python基础

在做机器学习的时候,遇到这样一个数据集...

一共399行10列,

1-9列是用不定长度的空格分割,

第9-10列之间用'\t'分割,

前九列都是数值类型,其中第三列有若干个'?'填充的缺失值...

第十列是字符串类型,..

部分数据截图:

python处理分隔符的数据集

之前我是用python强写的...很麻烦,代码如下:

python处理分隔符的数据集

python处理分隔符的数据集

至此,可以已平均值,填充缺失值...

今天再回顾此数据库;决定用pandas库来试试;

1,导包,用pandas.read_table导入数据集,

python处理分隔符的数据集

2,数据处理

python处理分隔符的数据集

最后输出如下:

python处理分隔符的数据集

以上这篇python处理两种分隔符的数据集方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

在python中画正态分布图像的实例

在python中画正态分布图像的实例

1.正态分布简介 正态分布(normal distribtution)又叫做高斯分布(Gaussian distribution),是一个非常重要也非常常见的连续概率分布。正态分布大家也...

Php多进程实现代码

php多进程实现 PHP有一组进程控制函数(编译时需要–enable-pcntl与posix扩展),使得php能在nginx系统中实现跟c一样的创建子进程、使用exec函数执行程序、处理...

python socket网络编程之粘包问题详解

python socket网络编程之粘包问题详解

一,粘包问题详情 1,只有TCP有粘包现象,UDP永远不会粘包 你的程序实际上无权直接操作网卡的,你操作网卡都是通过操作系统给用户程序暴露出来的接口,那每次你的程序要给远程发数据时,...

用Python的SimPy库简化复杂的编程模型的介绍

在我遇到 SimPy 包的其中一位创始人 Klaus Miller 时,从他那里知道了这个包。Miller 博士阅读过几篇提出使用 Python 2.2+ 生成器实现半协同例程和“轻便”...

详解Python计算机视觉 图像扭曲(仿射扭曲)

详解Python计算机视觉 图像扭曲(仿射扭曲)

对图像块应用仿射变换,我们将其称为图像扭曲(或者仿射扭曲)。该操作不仅经常应用在计算机图形学中,而且经常出现在计算机视觉算法中。 一、仿射变换原理 仿射变换能够保持图像的“平直性”,包括...