pandas重新生成索引的方法

yipeiwu_com6年前Python基础

在数据处理的过程中,出现了这样的问题,筛选某些数据,出现索引从600多开始,但是我希望这行数据下标从0开始。

这个时候,我想到的是:

df.reindex(range(length))

但是查看一下数据之后,发现0-624之间的值全为Nan,显然不是我需要的数据。

最后找到了说明:

pandas调用reindex方法后净会根据新索引进行重排,如果某个索引值当前不存在,就会引入

缺失值;可以通过fill_value参数填充默认值,也可以通过method参数设置填充方法;

感谢身边同事的帮助,找到了解决的方法:

df_new = df.set_index(drop=True) 他没有原地修改,因此需要重新赋值。

时候之后的效果就是,期待的625行的数据,变成了从0开始的下标。

以上这篇pandas重新生成索引的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

对django views中 request, response的常用操作详解

request 获取post请求中的json数据 def hello(request): data = json.loads(request.body) ... json格式还...

11个Python3字典内置方法大全与示例汇总

11个Python3字典内置方法大全与示例汇总

概述 在绝大部分的开发语言中与实际开发过程中,Dictionary扮演着举足轻重的角色。从我们的数据模型到服务器返回的参数到数据库的应用等等,Dictionary的身影无处不在。 在P...

Python中列表、字典、元组数据结构的简单学习笔记

列表 列表是Python中最具灵活性的有序集合对象类型。与字符串不同的是,列表可以包含任何类型的对象:数字、字符串甚至其他列表。列表是可变对象,它支持原地修改的操作。 Python的列表...

详解django自定义中间件处理

中间件是一个钩子框架,它们可以介入 Django 的请求和响应处理过程。 它是一个轻量级、底层的 插件 系统,用于在 全局修改 Django 的输入或输出 。 每个中间件组件负责完成某个...

python使用多进程的实例详解

python多线程适合IO密集型场景,而在CPU密集型场景,并不能充分利用多核CPU,而协程本质基于线程,同样不能充分发挥多核的优势。 针对计算密集型场景需要使用多进程,python的m...