python groupby 函数 as_index详解

yipeiwu_com6年前Python基础

在官方网站中对as_index有以下介绍:

as_index : boolean, default True

For aggregated output, return object with group labels as the index. Only relevant for DataFrame input. as_index=False is effectively “SQL-style” grouped output

翻译过来就是说as_index 的默认值为True, 对于聚合输出,返回以组标签作为索引的对象。仅与DataFrame输入相关。as_index = False实际上是“SQL风格”的分组输出。举例如下

import pandas as pd
 
df = pd.DataFrame(data={'books':['bk1','bk1','bk1','bk2','bk2','bk3'], 'price': [12,12,12,15,15,17]})
print df
print
print df.groupby('books', as_index=True).sum()
print
print df.groupby('books', as_index=False).sum()

输出如下:

 books price
0  bk1   12
1  bk1   12
2  bk1   12
3  bk2   15
4  bk2   15
5  bk3   17
 
    price
books   
bk1    36
bk2    30
bk3    17
 
 books price
0  bk1   36
1  bk2   30
2  bk3   17

代码中注释的两段代码报错,分析可以看到:

当as_index=True时,没有显示索引项,而是以第一列组标签为索引值,故不能通过df.loc[0]取值,可以通过df.loc[‘bk1']取值;

当as_index=False时,显示索引项,此时可以通过df.loc[0]取得值。因此as_index的作用是控制聚合输出是否以组标签为索引值。

以上这篇python groupby 函数 as_index详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

深入理解Python 代码优化详解

深入理解Python 代码优化详解

 选择了脚本语言就要忍受其速度,这句话在某种程度上说明了 python 作为脚本的一个不足之处,那就是执行效率和性能不够理想,特别是在 performance 较差的机器上,因此有必要进...

numpy向空的二维数组中添加元素的方法

直接上代码了 x = np.empty(shape=[0, 4], int) x = np.append(x, [[1,2,3,4]], axis = 0) x = np.appen...

Python实现读取并保存文件的类

本文实例讲述了Python实现读取并保存文件的类。分享给大家供大家参考,具体如下: 这个类写在一个叫class_format.py 的文件里, 放在D盘 >>> i...

使用python将mysql数据库的数据转换为json数据的方法

使用python将mysql数据库的数据转换为json数据的方法

由于产品运营部需要采用第三方个推平台,来推送消息。如果手动一个个键入字段和字段值,容易出错,且非常繁琐,需要将mysql的数据转换为json数据,直接复制即可。 本文将涉及到如何使用Py...

python批量修改文件夹及其子文件夹下的文件内容

python批量修改文件夹及其子文件夹下的文件内容

前言:前几天我看一位同学要修改很多文件中的数据,该文件数据很规律,一行只有三个数,需要将每行最后一个数字改为负数,但文件有上千个,分布在每个文件夹下面以及它的多级子文件夹下,看他用exc...