Pandas_cum累积计算和rolling滚动计算的用法详解
Pandas主要统计特征函数:
| 方法名 | 函数功能 |
|---|---|
| sum() | 计算数据样本的总和(按列计算) |
| mean() | 计算数据样本的算术平均数 |
| var() | 计算数据样本的方差 |
| std() | 计算数据样本的标准差 |
| corr() | 计算数据样本的Spearman(Pearman)相关系数矩阵 |
| cov() | 计算数据样本的协方差矩阵 |
| skew() | 样本值的偏度(三阶矩) |
| kurt() | 样本值的峰度(四阶矩) |
| describe() | 给出样本的基本描述(基本统计量如均值、标准差等) |
cum累积计算函数
cum系列函数是作为DataFrame或Series对象的方法出现的,因此命令格式为D.cumsum()
| 方法名 | 函数功能 |
|---|---|
| cumsum() | 依次给出前1、2、… 、n个数的和 |
| cumprod() | 依次给出前1、2、… 、n个数的积 |
| cummax() | 依次给出前1、2、… 、n个数的最大值 |
| cummin() | 依次给出前1、2、… 、n个数的最小值 |
计算出前n项和:
D=pd.Series(range(0,20)) D.cumsum() 0 0 1 1 2 3 3 6 .... 19 190 dtype: int64
rolling滚动计算函数
rolling_系列是pandas的函数,不是DataFrame或Series对象的方法,其格式为pd.rolling_mean(D,k),其中每k列计算一次平均值,滚动计算。
| 方法名 | 函数功能 |
|---|---|
| rolling_sum() | 计算数据样本的总和(按列计算) |
| rolling_mean() | 数据样本的算术平均数 |
| rolling_var() | 计算数据样本的方差 |
| rolling_std() | 计算数据样本的标准差 |
| rolling_corr() | 计算数据样本的Spearman(Pearman)相关系数矩阵 |
| rolling_cov() | 计算数据样本的协方差矩阵 |
| rolling_skew() | 样本值的偏度(三阶矩) |
| rolling_kurt() | 样本值的峰度(四阶矩) |
依次对相邻两项求和:
pd.rolling_sum(D,2) 0 NaN 1 1.0 2 3.0 3 5.0 4 7.0 .... 19 37.0 dtype: float64
以上这篇Pandas_cum累积计算和rolling滚动计算的用法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。


