利用Python将数值型特征进行离散化操作的方法

yipeiwu_com6年前Python基础

如下所示:

data = np.random.randn(20)
 
factor = pd.cut(data,4)
 
pd.get_dummies(factor)
 
0	0	0	0	1
1	1	0	0	0
2	0	0	0	1
3	0	0	1	0
4	1	0	0	0
5	0	1	0	0
6	0	1	0	0
7	0	1	0	0
8	0	0	1	0
9	0	1	0	0
10	0	0	0	1
11	0	1	0	0
12	0	1	0	0
13	0	0	1	0
14	0	0	1	0
15	0	1	0	0
16	0	1	0	0
17	1	0	0	0
18	0	0	1	0
19	0	0	0	1

其中参数中的4表示的是,划分为4段。

以上这篇利用Python将数值型特征进行离散化操作的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python配置文件处理的方法教程

Python配置文件处理的方法教程

前言 在平时的工程中,我们在构建工程时,常常需要用到配置文件,用来配置项目的一些信息,比如数据库,请求网址,文件夹,线程、进程数等信息,这样就可以方便我们通过修改配置文件中的参数来很好地...

导入tensorflow时报错:cannot import name 'abs'的解决

导入tensorflow时报错:cannot import name 'abs'的解决

一,问题背景 作者在用tensorflow做实验时,import tensorflow忽然报错:cannot import name 'abs'。错误情况如下所示: 这个问题出现的比较...

Python实现的合并两个有序数组算法示例

本文实例讲述了Python实现的合并两个有序数组算法。分享给大家供大家参考,具体如下: 思路 按位循环比较两个数组,较小元素的放入新数组,下标加一(注意,较大元素对应的下标不加一),直到...

Python求正态分布曲线下面积实例

Python求正态分布曲线下面积实例

正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。这种分布的概率密度函数为: 其中,μ为均值,σ为标准差。 求正态分布曲线下面积有3σ原则: 正态曲线下,横轴区间(μ-σ,μ+...

Python中的map、reduce和filter浅析

1、先看看什么是 iterable 对象 以内置的max函数为例子,查看其doc:复制代码 代码如下:>>> print max.__doc__max(iterable...