pd.DataFrame统计各列数值多少的实例

yipeiwu_com5年前Python基础

如下所示:

.count()   #非空元素计算
.min() a   #最小值
.max()   #最大值
.idxmin()   #最小值的位置,类似于R中的which.min函数
.idxmax()   #最大值的位置,类似于R中的which.max函数
.quantile(0.75) #75%分位数
.sum()   #求和
.mean()   #均值
.median()   #中位数
.mode()   #众数
.var()   #方差
.std()   #标准差
.mad()   #平均绝对偏差
.skew()   #偏度
.kurt()   #峰度
.describe()  #一次性输出多个描述性统计指标

如果你想统计各个列大于0的元素个数:

data[data>0].count()

会出现各个属性(列)大于零的个数

data[data['A']>0].count()

列A大于0的个数

这里说明,data的数据格式必须是DataFrame

pd.Series().value_counts(),会统计各个类的统计值。

我们在用这些函数时,会迷茫,不知道什么时候value_counts(),什么时候count()

这和前面的数据形式是有关的,只要前面是Series数据,要用value_counts(),前面数据形式是DataFrame要用count()

以上这篇pd.DataFrame统计各列数值多少的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python自动化测试之如何解析excel文件

前言 自动化测试中我们存放数据无非是使用文件或者数据库,那么文件可以是csv,xlsx,xml,甚至是txt文件,通常excel文件往往是我们的首选,无论是编写测试用例还是存放测试数据,...

Python API自动化框架总结

Python API自动化框架总结

学完了Python脚本接口自动化之后,一直没有对该框架做总结,今天终于试着来做一份总结了。 框架结构如下图: 来说一下每个目录的作用: Configs:该目录下存放的是.conf,.i...

Python中turtle库的使用实例

Python中turtle库的使用实例

Turtle库是Python内置的图形化模块,属于标准库之一,位于Python安装目录的lib文件夹下,常用函数有以下几种: 画笔控制函数 penup():抬起画笔; pen...

python 实现selenium断言和验证的方法

最近在学习自动化测试,网上资料是挺多的,但是都是很基础的,想深入一点了解就没有资料了。于是开始自己研究。 这两天在看selenium验证和断言方面的资料。 断言就是判断是否跟预期结果一致...

Python高级特性——详解多维数组切片(Slice)

(1) 我们先用arange函数创建一个数组并改变其维度,使之变成一个三维数组: >>> a = np.arange(24).reshape(2,3,4) >...