Pandas GroupBy对象 索引与迭代方法

yipeiwu_com5年前Python基础

如下所示:

import pandas as pd
df = pd.DataFrame({'性别' : ['男', '女', '男', '女',
        '男', '女', '男', '男'],
      '成绩' : ['优秀', '优秀', '及格', '差',
        '及格', '及格', '优秀', '差'],
      '年龄' : [15,14,15,12,13,14,15,16]})
GroupBy=df.groupby("性别")

GroupBy.iter()

GroupBy对象是一个迭代对象,每次迭代结果是一个元组,元组的第一个元素是该组的名称(就是groupby的列的元素名称),第二个元素是该组的具体信息,是一个数据框,索引是以前的数据框的总索引

for name,group in GroupBy:
 print(name)
 print(group)
女
 年龄 性别 成绩
1 14 女 优秀
3 12 女 差
5 14 女 及格
男
 年龄 性别 成绩
0 15 男 优秀
2 15 男 及格
4 13 男 及格
6 15 男 优秀
7 16 男 差

GroupBy.groups

显示分组的组名,以及所对应的索引

print(GroupBy.groups)
{'女': Int64Index([1, 3, 5], dtype='int64'), '男': Int64Index([0, 2, 4, 6, 7], dtype='int64')}

GroupBy.indices

类似于GroupBy.groups

print(GroupBy.indices)
{'女': array([1, 3, 5], dtype=int64), '男': array([0, 2, 4, 6, 7], dtype=int64)}

GroupBy.get_group(name[, obj])

获得某一个分组的具体信息

In [2]: GroupBy.get_group("男")
Out[2]: 
 年龄 性别 成绩
0 15 男 优秀
2 15 男 及格
4 13 男 及格
6 15 男 优秀
7 16 男 差

Grouper([key, level, freq, axis, sort])

应用

可以先通过循环获得所有的组的名称

for name in GroupBy:
 print(name)# 获得所有分组的名称
 GroupBy.get_group(name) #获得所有该名称的数据

以上这篇Pandas GroupBy对象 索引与迭代方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Pandas实现dataframe和np.array的相互转换

网上找了半天 不是dataframe转化成array的就是array转化dataframe,所以这里给汇总一下,相互转换的python代如下: dataframe转化成array d...

python批量修改文件夹及其子文件夹下的文件内容

python批量修改文件夹及其子文件夹下的文件内容

前言:前几天我看一位同学要修改很多文件中的数据,该文件数据很规律,一行只有三个数,需要将每行最后一个数字改为负数,但文件有上千个,分布在每个文件夹下面以及它的多级子文件夹下,看他用exc...

详解Python的Django框架中的Cookie相关处理

浏览器的开发者在很早的时候就已经意识到, HTTP's 的无状态会对Web开发者带来很大的问题,于是(cookies)应运而生。 cookies 是浏览器为 Web 服务器存储的一小段信...

手把手教你如何安装Pycharm(详细图文教程)

手把手教你如何安装Pycharm(详细图文教程)

本文介绍了手把手教你如何安装Pycharm,分享给大家,具体如下: 1、首先去Pycharm官网,或者直接输入网址:http://www.jetbrains.com/pycharm/d...

Python中每次处理一个字符的5种方法

目的 对字符串的每个字符进行处理,其实每个字符(Char)就是一个长度为1的字符串。 方法 1.使用内建函数list() 复制代码 代码如下: >>> A_string...