pd.DataFrame统计各列数值多少的实例

yipeiwu_com6年前Python基础

如下所示:

.count()   #非空元素计算
.min() a   #最小值
.max()   #最大值
.idxmin()   #最小值的位置,类似于R中的which.min函数
.idxmax()   #最大值的位置,类似于R中的which.max函数
.quantile(0.75) #75%分位数
.sum()   #求和
.mean()   #均值
.median()   #中位数
.mode()   #众数
.var()   #方差
.std()   #标准差
.mad()   #平均绝对偏差
.skew()   #偏度
.kurt()   #峰度
.describe()  #一次性输出多个描述性统计指标

如果你想统计各个列大于0的元素个数:

data[data>0].count()

会出现各个属性(列)大于零的个数

data[data['A']>0].count()

列A大于0的个数

这里说明,data的数据格式必须是DataFrame

pd.Series().value_counts(),会统计各个类的统计值。

我们在用这些函数时,会迷茫,不知道什么时候value_counts(),什么时候count()

这和前面的数据形式是有关的,只要前面是Series数据,要用value_counts(),前面数据形式是DataFrame要用count()

以上这篇pd.DataFrame统计各列数值多少的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python简单实现旋转图片的方法

本文实例讲述了python简单实现旋转图片的方法。分享给大家供大家参考。具体实现方法如下: # rotate an image counter-clockwise using the...

Python 条件判断的缩写方法

return (1==1) ? "is easy" : "my god" //C...

Python中使用hashlib模块处理算法的教程

Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。 什么是摘要算法呢?摘要算法又称哈希算法、散列算法。它通过一个函数,把任意长度的数据转换为一个长度固定的数据串(...

利用python计算windows全盘文件md5值的脚本

利用python计算windows全盘文件md5值的脚本

import hashlib import os import time import configparser import uuid def test_file_md5(fi...

Python SMTP发送邮件遇到的一些问题及解决办法

Python SMTP发送邮件遇到的一些问题及解决办法

Python练习内容: SMTP是发送邮件的协议,Python内置对SMTP的支持,可以发送纯文本邮件、HTML邮件以及带附件的邮件。 Python对SMTP支持有smtplib和ema...