python 读取.csv文件数据到数组(矩阵)的实例讲解

yipeiwu_com6年前Python基础

利用numpy库

(缺点:有缺失值就无法读取)

读:

import numpy 
my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0) 

写:

numpy.savetxt('2.csv', my_matrix, delimiter = ',')

可能遇到的问题:

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position

原因是文件路径名中含有转义字符,将路径中的\换成\即可。

利用pandas库

读:(可以处理缺失值)

>>> import pandas as pd
>>> df = pd.read_csv('D:\Python\\l\B_train1.csv')
>>> df.values
>>> df.as_matrix(columns=None)

写:(将dataFrame直接写入)

>>> testB = test[test.intersection_id.isin(["B"])]
>>> pd.DataFrame.to_csv(testB,"D:\Python\\k\\t5B.csv")
#testB是个dataFrame

利用sklearn包中的Imputer处理缺失值

>>> m = df.as_matrix(columns=None)
>>> from sklearn.preprocessing import Imputer
>>> imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
>>> imp.fit(m)
Imputer(axis=0, copy=True, missing_values='NaN', strategy='mean', verbose=0)
>>> imp.transform(m)

以上这篇python 读取.csv文件数据到数组(矩阵)的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python+pandas生成指定日期和重采样的方法

python 日期的范围、频率、重采样以及频率转换 pandas有一整套的标准时间序列频率以及用于重采样、频率推断、生成固定频率日期范围的工具。 生成指定日期范围的范围 pandas.d...

对pandas中apply函数的用法详解

对pandas中apply函数的用法详解

最近在使用apply函数,总结一下用法。 apply函数可以对DataFrame对象进行操作,既可以作用于一行或者一列的元素,也可以作用于单个元素。 例:列元素 行元素 列 行...

python按照多个字符对字符串进行分割的方法

本文实例讲述了python按照多个字符对字符串进行分割的方法。分享给大家供大家参考。具体分析如下: 这段python代码通过这规则表达式对字符串进行分割,使用\w作为分割符,只要不是字母...

Python实现的几个常用排序算法实例

前段时间为准备百度面试恶补的东西,虽然最后还是被刷了,还是把那几天的“战利品”放点上来,算法一直是自己比较薄弱的地方,以后还要更加努力啊。 下面用Python实现了几个常用的排序,如快速...

python中通过selenium简单操作及元素定位知识点总结

python中通过selenium简单操作及元素定位知识点总结

  浏览器的简单操作 # 导入webdriver模块 # 创建driver对象,指定Chrome浏览器 driver = webdriver.Chrome() # 窗口...