pandas 对group进行聚合的例子

yipeiwu_com6年前Python基础

如下所示:

DataFrameGroupBy.agg(arg, *args, **kwargs) 

例子:

>>> df = pd.DataFrame({'A': [1, 1, 2, 2],
...     'B': [1, 2, 3, 4],
...     'C': np.random.randn(4)})

输出:

>>> df
 A B   C
0 1 1 0.362838
1 1 2 0.227877
2 2 3 1.267767
3 2 4 -0.562860

对每一行使用agg函数

>>> df.groupby('A').agg('min')
 B   C
A
1 1 0.227877
2 3 -0.562860

对多列使用多个agg函数:

>>> df.groupby('A').agg(['min', 'max'])
 B    C
 min max  min  max
A
1 1 2 0.227877 0.362838
2 3 4 -0.562860 1.267767

选择一列使用agg函数:

>>> df.groupby('A').B.agg(['min', 'max'])
 min max
A
1 1 2
2 3 4
>>> df.groupby('A').agg({'B': ['min', 'max'], 'C': 'sum'})
 B    C
 min max  sum
A
1 1 2 0.590716
2 3 4 0.704907

以上这篇pandas 对group进行聚合的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

pandas多级分组实现排序的方法

pandas有groupby分组函数和sort_values排序函数,但是如何对dataframe分组之后排序呢? In [70]: df = pd.DataFrame(((rand...

Python+Selenium+PIL+Tesseract自动识别验证码进行一键登录

Python+Selenium+PIL+Tesseract自动识别验证码进行一键登录

本文介绍了Python+Selenium+PIL+Tesseract自动识别验证码进行一键登录,分享给大家,具体如下: Python 2.7 IDE Pycharm 5.0.3...

解决Python pandas plot输出图形中显示中文乱码问题

解决方式一: import matplotlib #1. 获取matplotlibrc文件所在路径 matplotlib.matplotlib_fname() #Out[3]: u'...

python 平衡二叉树实现代码示例

python 平衡二叉树实现代码示例

平衡二叉树: 在上一节二叉树的基础上我们实现,如何将生成平衡的二叉树 所谓平衡二叉树: 我自己定义就是:任何一个节点的左高度和右高度的差的绝对值都小于2 如图所示,此时a的左高度等于3,...

详解pandas删除缺失数据(pd.dropna()方法)

详解pandas删除缺失数据(pd.dropna()方法)

1.创建带有缺失值的数据库: import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(5,...