pd.DataFrame统计各列数值多少的实例

yipeiwu_com5年前Python基础

如下所示:

.count()   #非空元素计算
.min() a   #最小值
.max()   #最大值
.idxmin()   #最小值的位置,类似于R中的which.min函数
.idxmax()   #最大值的位置,类似于R中的which.max函数
.quantile(0.75) #75%分位数
.sum()   #求和
.mean()   #均值
.median()   #中位数
.mode()   #众数
.var()   #方差
.std()   #标准差
.mad()   #平均绝对偏差
.skew()   #偏度
.kurt()   #峰度
.describe()  #一次性输出多个描述性统计指标

如果你想统计各个列大于0的元素个数:

data[data>0].count()

会出现各个属性(列)大于零的个数

data[data['A']>0].count()

列A大于0的个数

这里说明,data的数据格式必须是DataFrame

pd.Series().value_counts(),会统计各个类的统计值。

我们在用这些函数时,会迷茫,不知道什么时候value_counts(),什么时候count()

这和前面的数据形式是有关的,只要前面是Series数据,要用value_counts(),前面数据形式是DataFrame要用count()

以上这篇pd.DataFrame统计各列数值多少的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python3中关于cookie的创建与保存

1.cookie的作用 cookie 是指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据,就像有些网站上的一些数据是需要登录后才能看得到,那么想抓取某个页面...

对Django外键关系的描述

注:本文需要你有一定的数据库知识,本文的数据库语法使用mysql书写 Django中,跟外键有关的关系有三种,下面来一一介绍。 OneToManyField 这种最好理解,说白了就是最普...

Python下线程之间的共享和释放示例

最近被多线程给坑了下,没意识到类变量在多线程下是共享的,还有一个就是没意识到 内存释放问题,导致越累越大 1.python 类变量 在多线程情况 下的 是共享的 2.python 类变量...

numpy ndarray 按条件筛选数组,关联筛选的例子

最近的项目中大量涉及数据的预处理工作,对于ndarray的使用非常频繁。其中ndarray如何进行数值筛选,总结了几种方法。 1.按某些固定值筛选 如下面这段代码从,ndarray中可...

对python pandas 画移动平均线的方法详解

数据文件 66001_.txt 内容格式: date,jz0,jz1,jz2,jz3,jz4,jz5 2012-12-28,0.9326,0.8835,1.0289,1.0027,1...