对python打乱数据集中X,y标签对的方法详解

yipeiwu_com6年前Python基础

今天踩过的两个小坑:

一.用random的shuffle打乱数据集中的数据-标签对

index=[i for i in range(len(X_batch))]
# print(type(index))
index=random.shuffle(index)

结果shuffle完以后index变成None了,看了下api,这样说明的:

python打乱数据集中X,y标签

这个函数如果返回值,就返回None,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。

python打乱数据集中X,y标签

因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。

二.整体引用index这个list中的数据

因为index是一个list,所以代码这样写:

X_batch=X_batch[index]

Y_batch=Y_batch[index]

是有问题的,报错是:TypeError: list indices must be integers or slices, not list.

这是因为我的X_batch,Y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果X_batch,Y_batch是数组,index是数组,就可以。

所以代码改成了:

X_batch,Y_batch=data_generator(data_path)
index=[i for i in range(len(X_batch))]
# print(type(index))
random.shuffle(index)
index=np.array(index)

X_batch=[np.array(X_batch)[index]]
Y_batch=[np.array(Y_batch)[index]]

参考代码:

python打乱数据集中X,y标签

以上这篇对python打乱数据集中X,y标签对的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Linux RedHat下安装Python2.7开发环境

Linux RedHat下安装Python2.7开发环境

Linux RedHat下安装Python2.7、pip、ipython环境、eclipse和PyDev环境 准备工作,源Python2.6备份: 根据which python具体目录而...

Python实现对PPT文件进行截图操作的方法

本文实例讲述了Python实现对PPT文件进行截图操作的方法。分享给大家供大家参考。具体分析如下: 下面的代码可以为powerpoint文件ppt进行截图,可以指定要截取的幻灯片页面,需...

利用python程序生成word和PDF文档的方法

一、程序导出word文档的方法 将web/html内容导出为world文档,再java中有很多解决方案,比如使用Jacob、Apache POI、Java2Word、iText等各种方式...

用Python编写分析Python程序性能的工具的教程

用Python编写分析Python程序性能的工具的教程

虽然并非你编写的每个 Python 程序都要求一个严格的性能分析,但是让人放心的是,当问题发生的时候,Python 生态圈有各种各样的工具可以处理这类问题。 分析程序的性能可以归结为回答...

Python Django的安装配置教程图文详解

Python Django的安装配置教程图文详解

Django 教程 Python下有许多款不同的 Web 框架。Django是重量级选手中最有代表性的一位。许多成功的网站和APP都基于Django。 Django是一个开放源代码的We...