Python利用pandas计算多个CSV文件数据值的实例

yipeiwu_com6年前Python基础

功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件

pip install pandas

import pandas as pd
import glob,os,sys
input_path='./'
output_fiel='pandas_union_concat.csv'
all_files=glob.glob(os.path.join(input_path,'sales_*'))
all_data_frames=[]
for file in all_files:
  data_frame=pd.read_csv(file,index_col=None)
  total_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).sum()
  average_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).mean()
  data={
    'filename':os.path.basename(file),
    'total_sales':total_sales,
    'average_sales':average_sales
  }
  all_data_frames.append(pd.DataFrame(data,columns=['filename','total_sales','average_sales']))
data_frame_concat=pd.concat(all_data_frames,axis=0,ignore_index=True)
data_frame_concat.to_csv(output_fiel,index=False)

以上这篇Python利用pandas计算多个CSV文件数据值的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

如何更改 pandas dataframe 中两列的位置

如何更改 pandas dataframe 中两列的位置

如何更改 pandas dataframe 中两列的位置: 把其中的某列移到第一列的位置。 原来的 df 是: df = pd.read_csv('I:/Papers/consume...

浅谈python和C语言混编的几种方式(推荐)

Python这些年风头一直很盛,占据了很多领域的位置,Web、大数据、人工智能、运维均有它的身影,甚至图形界面做的也很顺,乃至full-stack这个词语刚出来的时候,似乎就是为了描述它...

python logging类库使用例子

一、简单使用 复制代码 代码如下: def TestLogBasic():     import logging     l...

基于python yield机制的异步操作同步化编程模型

本文总结下如何在编写python代码时对异步操作进行同步化模拟,从而提高代码的可读性和可扩展性。      游戏引擎一般都采用分布式框架,通过一定...

Python中使用语句导入模块或包的机制研究

这篇文章讨论了Python的from <module> import *和from <package> import *,它们怎么执行以及为什么使用这种语法(也许...