python 实现对数据集的归一化的方法(0-1之间)

yipeiwu_com5年前Python基础

多数情况下,需要对数据集进行归一化处理,再对数据进行分析

 #首先,引入两个库 ,numpy,sklearn
from sklearn.preprocessing import MinMaxScaler
import numpy as np
 #将csv文件导入矩阵当中
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
 #将数据集进行归一化处理
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)

 #最后的my_matrix_normorlize 实现了归一化my_matrix_normorlize

完整未解释代码:

from sklearn.preprocessing import MinMaxScaler
import numpy as np
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)

以上这篇python 实现对数据集的归一化的方法(0-1之间)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python 同时运行多个程序的实例

start many programs execfile('C:/Dokumente und Einstellungen/schnei17/Desktop/python/zeit/1...

基于Python新建用户并产生随机密码过程解析

说明:本次代码是在Linux下执行的,windows也可以用,把添加用户密码的命令改成windows的就ok了 用Python新建用户并产生随机密码 import passwd_na...

Python Pandas找到缺失值的位置方法

问题描述: python pandas判断缺失值一般采用 isnull(),然而生成的却是所有数据的true/false矩阵,对于庞大的数据dataframe,很难一眼看出来哪个数据缺...

基于pycharm导入模块显示不存在的解决方法

基于pycharm导入模块显示不存在的解决方法

最近,同级或者不同级目录下,导入某个模块,显示不存在,可明明存在,百度找了好多没找到,试了 import sys sys.path.append('/path/to/test') /...

python过滤中英文标点符号的实例代码

如下所示: import re # 过滤不了\\ \ 中文()还有———— r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@...