python训练数据时打乱训练数据与标签的两种方法小结

yipeiwu_com6年前Python基础

如下所示:

<code class="language-python">import numpy as np 
 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
y = np.array([1,2,3,4,5])
 
print '-------第1种方法:通过打乱索引从而打乱数据,好处是1:数据量很大时能够节约内存,2每次都不一样----------' 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
data_num, _= data.shape #得到样本数 
index = np.arange(data_num) # 生成下标 
np.random.shuffle(index) 
print '-------原数据:----------' 
print '数据:',data 
print '标签:', y
print '-------打乱数据:----------' 
print '数据:',data[index] 
print '标签:',y[index]

print '-------第2种方法:直接的打乱数据,利用随机数种子,好处:每次打乱的顺序是固定的----------' 
data = np.array([[1,1],[2,2],[3,3],[4,4],[5,5]]) 
y = np.array([1,2,3,4,5])

print '-------原数据:----------' 
print '数据:',data 
print '标签:', y
print '-------打乱数据:----------' 
np.random.seed(116)
np.random.shuffle(data) 
np.random.seed(116)
np.random.shuffle(y) 
print '数据:',data 
print '标签:', y</code>

以上这篇python训练数据时打乱训练数据与标签的两种方法小结就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

分享8个非常流行的 Python 可视化工具包

分享8个非常流行的 Python 可视化工具包

喜欢用 Python 做项目的小伙伴不免会遇到这种情况:做图表时,用哪种好看又实用的可视化工具包呢?之前文章里出现过漂亮的图表时,也总有读者在后台留言问该图表时用什么工具做的。下面,作者...

详解python:time模块用法

详解python:time模块用法

time模块下有两种时间表示方法: 第1种是:时间戳的方式。是基于1970年1月1日0时0分0秒的偏移。浮点数。 第2种是:struct_time()类型的表示方法。gmtime()和l...

python分布式环境下的限流器的示例

项目中用到了限流,受限于一些实现方式上的东西,手撕了一个简单的服务端限流器。 服务端限流和客户端限流的区别,简单来说就是: 1)服务端限流 对接口请求进行限流,限制的是单位时间内请求的数...

Python有序查找算法之二分法实例分析

Python有序查找算法之二分法实例分析

本文实例讲述了Python有序查找算法之二分法。分享给大家供大家参考,具体如下: 二分法是一种快速查找的方法,时间复杂度低,逻辑简单易懂,总的来说就是不断的除以2除以2... 例如需要查...

python筛选出两个文件中重复行的方法

本文实例为大家分享了python脚本筛选出两个文件中重复的行数,供大家参考,具体内容如下 ''' 查找A文件中,与B文件中内容不重复的内容 ''' #!usr/bin/python...