利用Python将数值型特征进行离散化操作的方法

yipeiwu_com6年前Python基础

如下所示:

data = np.random.randn(20)
 
factor = pd.cut(data,4)
 
pd.get_dummies(factor)
 
0	0	0	0	1
1	1	0	0	0
2	0	0	0	1
3	0	0	1	0
4	1	0	0	0
5	0	1	0	0
6	0	1	0	0
7	0	1	0	0
8	0	0	1	0
9	0	1	0	0
10	0	0	0	1
11	0	1	0	0
12	0	1	0	0
13	0	0	1	0
14	0	0	1	0
15	0	1	0	0
16	0	1	0	0
17	1	0	0	0
18	0	0	1	0
19	0	0	0	1

其中参数中的4表示的是,划分为4段。

以上这篇利用Python将数值型特征进行离散化操作的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

使用python模拟高斯分布例子

使用python模拟高斯分布例子

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution) 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,...

Python用于学习重要算法的模块pygorithm实例浅析

本文实例讲述了Python用于学习重要算法的模块pygorithm。分享给大家供大家参考,具体如下: 这是一个能够随时学习重要算法的Python模块,纯粹是为了教学使用。 特点 易...

python之DataFrame实现excel合并单元格

python之DataFrame实现excel合并单元格

在工作中经常遇到需要将数据输出到excel,且需要对其中一些单元格进行合并,比如如下表表格,需要根据A列的值,合并B、C列的对应单元格 pandas中的to_excel方法只能对索引进...

python算法学习之基数排序实例

基数排序法又称桶子法(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,将要排序的元素分配至某些"桶"中,藉以达到排序的作用,基数排序法是属于稳定性的排序,其...

基于Django统计博客文章阅读量

如何精确地记录一篇文章的阅读量是一个比较复杂的问题,不过对于我们的博客来说,没有必要记录的那么精确。因此我们使用一种简单但有效的方式来记录博客文章的阅读量:文章每被浏览一次,则其阅读量...