pd.DataFrame统计各列数值多少的实例

yipeiwu_com6年前Python基础

如下所示:

.count()   #非空元素计算
.min() a   #最小值
.max()   #最大值
.idxmin()   #最小值的位置,类似于R中的which.min函数
.idxmax()   #最大值的位置,类似于R中的which.max函数
.quantile(0.75) #75%分位数
.sum()   #求和
.mean()   #均值
.median()   #中位数
.mode()   #众数
.var()   #方差
.std()   #标准差
.mad()   #平均绝对偏差
.skew()   #偏度
.kurt()   #峰度
.describe()  #一次性输出多个描述性统计指标

如果你想统计各个列大于0的元素个数:

data[data>0].count()

会出现各个属性(列)大于零的个数

data[data['A']>0].count()

列A大于0的个数

这里说明,data的数据格式必须是DataFrame

pd.Series().value_counts(),会统计各个类的统计值。

我们在用这些函数时,会迷茫,不知道什么时候value_counts(),什么时候count()

这和前面的数据形式是有关的,只要前面是Series数据,要用value_counts(),前面数据形式是DataFrame要用count()

以上这篇pd.DataFrame统计各列数值多少的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python抽象类的新写法

记得之前learn python一书里面,因为当时没有官方支持,只能通过hack的方式实现抽象方法,具体如下 最简单的写法 class MyCls(): def foo(self...

详解Python的Django框架中的通用视图

详解Python的Django框架中的通用视图

通用视图 1. 前言 回想一下,在Django中view层起到的作用是相当于controller的角色,在view中实施的 动作,一般是取得请求参数,再从model中得到数据,再通过数据...

python使用minimax算法实现五子棋

这是一个命令行环境的五子棋程序。使用了minimax算法。 除了百度各个棋型的打分方式,所有代码皆为本人所撸。本程序结构与之前的井字棋、黑白棋一模一样。 有一点小问题,没时间弄了,就这样...

python 生成器协程运算实例

一、yield运行方式 我们定义一个如下的生成器: def put_on(name): print("Hi {}, 货物来了,准备搬到仓库!".format(name)) wh...

python创建ArcGIS shape文件的实现

工作中遇到了一个需求,需要把一段json文本转化成ArcGIS shape文件,想来想去,还是考虑用python来实现。 直接上代码 import shapefile import...