pandas 对group进行聚合的例子

yipeiwu_com6年前Python基础

如下所示:

DataFrameGroupBy.agg(arg, *args, **kwargs) 

例子:

>>> df = pd.DataFrame({'A': [1, 1, 2, 2],
...     'B': [1, 2, 3, 4],
...     'C': np.random.randn(4)})

输出:

>>> df
 A B   C
0 1 1 0.362838
1 1 2 0.227877
2 2 3 1.267767
3 2 4 -0.562860

对每一行使用agg函数

>>> df.groupby('A').agg('min')
 B   C
A
1 1 0.227877
2 3 -0.562860

对多列使用多个agg函数:

>>> df.groupby('A').agg(['min', 'max'])
 B    C
 min max  min  max
A
1 1 2 0.227877 0.362838
2 3 4 -0.562860 1.267767

选择一列使用agg函数:

>>> df.groupby('A').B.agg(['min', 'max'])
 min max
A
1 1 2
2 3 4
>>> df.groupby('A').agg({'B': ['min', 'max'], 'C': 'sum'})
 B    C
 min max  sum
A
1 1 2 0.590716
2 3 4 0.704907

以上这篇pandas 对group进行聚合的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python构建自定义回调函数详解

回调函数用起来比较爽。特别是在js中,满世界全是回调,那么在python中,怎么来优雅地实现自己的回调函数呢 下面贴一个我写的例子 class BaseHandler(object)...

利用Python操作消息队列RabbitMQ的方法教程

前言 RabbitMQ是一个在AMQP基础上完整的,可复用的企业消息系统。他遵循Mozilla Public License开源协议。 MQ全称为Message Queue, 消息队列(...

Pandas标记删除重复记录的方法

Pandas提供了duplicated、Index.duplicated、drop_duplicates函数来标记及删除重复记录 duplicated函数用于标记Series中的值、Da...

matplotlib调整子图间距,调整整体空白的方法

如下所示: fig.tight_layout()#调整整体空白 plt.subplots_adjust(wspace =0, hspace =0)#调整子图间距 以上这篇matp...

python基于gevent实现并发下载器代码实例

这篇文章主要介绍了python基于gevent实现并发下载器代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 并发下载原理...