Pandas_cum累积计算和rolling滚动计算的用法详解

yipeiwu_com5年前Python基础

Pandas主要统计特征函数:

方法名 函数功能
sum() 计算数据样本的总和(按列计算)
mean() 计算数据样本的算术平均数
var() 计算数据样本的方差
std() 计算数据样本的标准差
corr() 计算数据样本的Spearman(Pearman)相关系数矩阵
cov() 计算数据样本的协方差矩阵
skew() 样本值的偏度(三阶矩)
kurt() 样本值的峰度(四阶矩)
describe() 给出样本的基本描述(基本统计量如均值、标准差等)

cum累积计算函数

cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum()

方法名 函数功能
cumsum() 依次给出前1、2、… 、n个数的和
cumprod() 依次给出前1、2、… 、n个数的积
cummax() 依次给出前1、2、… 、n个数的最大值
cummin() 依次给出前1、2、… 、n个数的最小值

计算出前n项和:

D=pd.Series(range(0,20))
D.cumsum() 
0    0
1    1
2    3
3    6
....
19  190
dtype: int64

rolling滚动计算函数

rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。

方法名 函数功能
rolling_sum() 计算数据样本的总和(按列计算)
rolling_mean() 数据样本的算术平均数
rolling_var() 计算数据样本的方差
rolling_std() 计算数据样本的标准差
rolling_corr() 计算数据样本的Spearman(Pearman)相关系数矩阵
rolling_cov() 计算数据样本的协方差矩阵
rolling_skew() 样本值的偏度(三阶矩)
rolling_kurt() 样本值的峰度(四阶矩)

依次对相邻两项求和:

pd.rolling_sum(D,2)
0   NaN  
1   1.0
2   3.0
3   5.0
4   7.0
....
19  37.0
dtype: float64

以上这篇Pandas_cum累积计算和rolling滚动计算的用法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python操作Excel插入删除行的方法

1. 前言 由于近期有任务需要,要写一个能够处理Excel的脚本,实现的功能是,在A表格上其中一列,对字符串进行分组和排序,然后根据排序好的A表格以固定格式自动填写到B表格上。 开始写脚...

Python实例方法、类方法、静态方法的区别与作用详解

本文实例讲述了Python实例方法、类方法、静态方法的区别与作用。分享给大家供大家参考,具体如下: Python中至少有三种比较常见的方法类型,即实例方法,类方法、静态方法。它们是如何定...

python lxml中etree的简单应用

python lxml中etree的简单应用

我一般都是通过xpath解析DOM树的时候会使用lxml的etree,可以很方便的从html源码中得到自己想要的内容。 这里主要介绍一下我常用到的两个方法,分别是etree.HTML()...

Python的Django框架中URLconf相关的一些技巧整理

提供视图配置选项 如果你发布一个Django的应用,你的用户可能会希望配置上能有些自由度。 这种情况下,为你认为用户可能希望改变的配置选项添加一些钩子到你的视图中会是一个很好的主意。 你...

python中OrderedDict的使用方法详解

很多人认为python中的字典是无序的,因为它是按照hash来存储的,但是python中有个模块collections(英文,收集、集合),里面自带了一个子类 OrderedDict,实...