pandas-resample按时间聚合实例

yipeiwu_com6年前Python基础

如下所示:

import pandas as pd

#如果需要的话,需将df中的date列转为datetime

df.date = pd.to_datetime(df.date,format="%Y%m%d")

#将改好格式的date列,设置为df的index

df.set_index('date',drop=True)


#按年来提数据 (因为此时的datetime已经为index了,可以直接[]取行内容)

df['2018']

df['2018':'2021']

#按月来提数据

df['2018-01']

df['2018-01':'2018-05']

#按天来提出数据

df['2018-05-24':'2018-09-27']


#按日期汇总数据

#将数据以W星期,M月,Q季度,QS季度的开始第一天开始,A年,10A十年,10AS十年聚合日期第一天开始.的形式进行聚合

df.resample('W').sum()

df.resample('M').sum()


#具体某列的数据聚合

df.price.resample('W').sum().fillna(0) #星期聚合,以0填充NaN值

#某两列

df[['price','num']].resample('W').sum().fillna(0)

#某个时间段内,以W聚合,

df["2018-5":"2018-9"].resample("M").sum().fillna(0)

还有以下方式聚合

以上这篇pandas-resample按时间聚合实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python采集博客中上传的QQ截图文件

哎,以前写博文的时候没注意,有些图片用QQ来截取,获得的图片文件名都是类似于QQ截图20120926174732-300×15.png的形式,昨天用ftp备份网站文件的时候发现,中文名在...

使用相同的Apache实例来运行Django和Media文件

Django本身不用来服务media文件;应该把这项工作留给你选择的网络服务器。 我们推荐使用一个单独的网络服务器(即没有运行Django的一个)来服务media。 想了解更多信息,看下...

python如何查看系统网络流量的信息

前言 流量信息可以直接在/proc/net/dev中进行查看,笔者实现的程序使用命令: python net.py interface 其中interface为网卡名称,使用什么网...

对python_discover方法遍历所有执行的用例详解

对python_discover方法遍历所有执行的用例详解

当我们写了一个单个py的测试文件时直接运行就ok了,但当我们有很多很多个这样的py时,难道要一个一个的点击来运行吗,当然不是。我们可以通过discover方法来找到所有的用例。 下面直接...

python获取mp3文件信息的方法

本文实例讲述了python获取mp3文件信息的方法。分享给大家供大家参考。具体如下: 将代码生成.py文件放在目录下运行,可以获取该目录的所有mp3文件的信息,需要使用ID3库 im...