解决Python pandas df 写入excel 出现的问题

yipeiwu_com5年前Python基础

学习Python数据分析挖掘实战一书时,在数据预处理阶段,有一节要使用拉格朗日插值法对缺失值补充,代码如下:

#-*- coding:utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt
from scipy.interpolate import lagrange#导入拉格朗日插值函数

inputfile="catering_sale.xls"
outputfile="H:\python\file\python_data_annalysis_mining\chapter04\sales.xls"

data=pd.read_excel(inputfile,sheetname=0)
statistic=data.describe()#保存基本统计量
print statistic

time=data[u'日期'].values
number=data[u'销量'].values
plt.scatter(time,number)
plt.show()#根据散点图找过滤异常值的方法

data[u'销量'][(data[u'销量']<300)|(data[u'销量']>6000)]=None#过滤异常值,设置为空

#自定义列向量插值函数
#s为列向量,n为插值位置,k为取前后的数据个数,默认为5,不宜太多,受到数值不稳定性影响
def ployinterp_column(s,n,k=5):
 y=s[list(range(n-k,n))+list(range(n+1,n+1+k))]
 y=y[y.notnull()]#剔除异常值
 return lagrange(y.index,list(y))(n)#插值并返回插值结果

for i in data.columns:
 for j in range(len(data)):
  if(data[i].isnull())[j]:
   data[i][j]=ployinterp_column(data[i],j)

data.to_excel(outputfile)

1.import xlwt 错误

这个问题比较简单,只需要在官网上下载安装或者直接在编译器中运行如下代码即可,

pip install xlwt

2.to_excel错误

这个错误是由于下面这句代码引起的,

data.to_excel(outputfile)

错误描述:无效的模式('w+b')或者文件名,意思是,出现这个问题的原因可能有两个,outputfile这个文件不可写入(w是“写”的意思),或者打开模式不对(b是以二进制方式写);另一种错误,文件名出错,很有可能是路径有问题,经过检查,确实是路径的问题,代码如下:

outputfile="H:\python\file\python_data_annalysis_mining\chapter04\sales.xls"

改为如下代码即可:

outputfile="H:\\python\\file\\python_data_annalysis_mining\\chapter04\\sales.xls"

即把单斜杠改为双斜杠,,因为存在转义问题。

以上这篇解决Python pandas df 写入excel 出现的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

详谈python read readline readlines的区别

详谈python read readline readlines的区别

file 对象使用 open 函数来创建,下表列出了 file 对象常用函数read、readline、readlines区别: 1.从文件读取指定的字节数,size如果未给定或为负则读...

pycharm: 恢复(reset) 误删文件的方法

pycharm: 恢复(reset) 误删文件的方法

昨晚写代码的时候,一不小心把某个代码文件误删了。。。赶紧上网找了一下pycharm如何恢复误删文件,结果还真有。 经过操作,成功恢复了误删文件。现将方法过程记录如下: Method 在P...

Python求解正态分布置信区间教程

Python求解正态分布置信区间教程

正态分布和置信区间 正态分布(Normal Distribution)又叫高斯分布,是一种非常重要的概率分布。其概率密度函数的数学表达如下: 置信区间是对该区间能包含未知参数的可置信的...

Python遍历文件夹 处理json文件的方法

有两种做法:os.walk()、pathlib库,个人感觉pathlib库的path.glob用来匹配文件比较简单。 下面是第二种做法的实例(第一种做法百度有很多文章): from...

对python遍历文件夹中的所有jpg文件的实例详解

python发现文件夹下所有的jpg文件,并且安装文件排放的顺序输出 glob模块是最简单的模块之一,内容非常少。用它可以查找符合特定规则的文件路径名。跟使用windows下的文件搜索差...