基于python cut和qcut的用法及区别详解

yipeiwu_com5年前Python基础

我就废话不多说了,直接上代码吧:

from pandas import Series,DataFrame
import pandas as pd
import numpy as np
from numpy import nan as NA
from matplotlib import pyplot as plt
ages = [20,22,25,27,21,23,37,31,61,45,41,32]
#将所有的ages进行分组
bins = [18,25,35,60,100]
#使用pandas中的cut对年龄数据进行分组
cats = pd.cut(ages,bins)
#print(cats)
#调用pd.value_counts方法统计每个区间的个数
number=pd.value_counts(cats)
#print(pd.value_counts(cats))
#显示第几个区间index值
index=pd.cut(ages,bins).codes
#print(index)
#为分类出来的每一组年龄加上标签
group_names = ["Youth","YouthAdult","MiddleAged","Senior"]
personType=pd.cut(ages,bins,labels=group_names)
#print(personType)
plt.hist(personType)
#plt.show()
#cut和qcut的用法
data=[1,2,3,4,5,6,7,8,9,10]
result=pd.qcut(data,4)
print(' ',result)##qcut会将10个数据进行排序,然后再将data数据均分成四组
#统计落在每个区间的元素个数
print('dasdasdasdasdas:  ',pd.value_counts(result))
#qcut : 跟cut一样也可以自定义分位数(0到1之间的数值,包括端点)
results=pd.qcut(data,[0,0.1,0.5,0.9,1])
print('results:  ',results)
import numpy as np
import pandas as pd
data = np.random.rand(20)
print(data)
#用cut函数将一组数据分割成n份
#cut函数分割的方式:数据里的(最大值-最小值)/n=每个区间的间距
#利用数据中最大值和最小值的差除以分组数作为每一组数据的区间范围的差值
result = pd.cut(data,4,precision=2) #precision保留小数点的有效位数
print(result)
res_data=pd.value_counts(result)
print(res_data)

以上这篇基于python cut和qcut的用法及区别详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

pymongo给mongodb创建索引的简单实现方法

本文实例讲述了pymongo给mongodb创建索引的简单实现方法。分享给大家供大家参考。具体如下: 下面的代码给user的user_name字段创建唯一索引 import pymo...

Python操作Excel插入删除行的方法

1. 前言 由于近期有任务需要,要写一个能够处理Excel的脚本,实现的功能是,在A表格上其中一列,对字符串进行分组和排序,然后根据排序好的A表格以固定格式自动填写到B表格上。 开始写脚...

对Python函数设计规范详解

Python函数的设计规范 1、Python函数设计时具备耦合性和聚合性 1)、耦合性: (1).尽可能通过参数接受输入,以及通过return产生输出以保证函数的独立性; (2).尽量减...

python实现代码统计器

本文实例为大家分享了python中的代码行数统计,供大家参考,具体内容如下 思路:统计文件中代码的总行数减去空行单行注释以及多行注释 功能: 1.获取文件内容的总行数 2.排除空行 单行...

Python高级特性切片(Slice)操作详解

切片操作首先支持下标索引,通过[ N:M :P ]操作 索引正向从0开始,逆向从-1开始 N:切片开始位置 M:切片结束位置(不包含) P:指定切片步长,为正数表示按照指定步长正向切片,...