python处理两种分隔符的数据集方法

yipeiwu_com6年前Python基础

在做机器学习的时候,遇到这样一个数据集...

一共399行10列,

1-9列是用不定长度的空格分割,

第9-10列之间用'\t'分割,

前九列都是数值类型,其中第三列有若干个'?'填充的缺失值...

第十列是字符串类型,..

部分数据截图:

python处理分隔符的数据集

之前我是用python强写的...很麻烦,代码如下:

python处理分隔符的数据集

python处理分隔符的数据集

至此,可以已平均值,填充缺失值...

今天再回顾此数据库;决定用pandas库来试试;

1,导包,用pandas.read_table导入数据集,

python处理分隔符的数据集

2,数据处理

python处理分隔符的数据集

最后输出如下:

python处理分隔符的数据集

以上这篇python处理两种分隔符的数据集方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

flask框架使用orm连接数据库的方法示例

本文实例讲述了flask框架使用orm连接数据库的方法。分享给大家供大家参考,具体如下: 注:使用前请安装flask_sqlalchemy包,由于python-mysql不适用于pyth...

详解Python 装饰器执行顺序迷思

探究多个装饰器执行顺序 装饰器是Python用于封装函数或代码的工具,网上可以搜到很多文章可以学习,我在这里要讨论的是多个装饰器执行顺序的一个迷思。 疑问 大部分涉及多个装饰器装饰的...

python简单实现计算过期时间的方法

本文实例讲述了python简单实现计算过期时间的方法。分享给大家供大家参考。具体如下: def time_passed(value): now = datetime.now()...

将Python中的数据存储到系统本地的简单方法

有很多时候,我们会在python的运行过程中得到一些重要的变量,比如一个数据量很庞大的dict。而且,后面的某些程序也会用到这个dict,那么我们就最好把它存储到本地来,然后下次调用的时...

在Python的Django框架中用流响应生成CSV文件的教程

在Django里,流式响应StreamingHttpResponse是个好东西,可以快速、节省内存地产生一个大型文件。 目前项目里用于流式响应的一个是Eventsource,用于改善跨系...