pandas 实现将重复表格去重,并重新转换为表格的方法

yipeiwu_com6年前Python基础

在python处理数据时,经常用到DataFrame和set。

train=pd.read_csv('XXX.csv')#读取文件 
train=train['item_id']#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame 
data.to_csv('xxx.csv',index=False)#保存表格 

记得导入pandas哦~

以上这篇pandas 实现将重复表格去重,并重新转换为表格的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

关于python3中setup.py小概念解析

关于 python setup.py bdist python setup.py sdist 两者的区别 sdist 指的是source dist 即源码发布,带s...

Django 如何获取前端发送的头文件详解(推荐)

Django 如何获取前端发送的头文件详解(推荐)

Django里面,我们知道可以在函数里面里面通过参数获取前端发来的数据。 比如可以通过request获取各种form的值啊,cookie啊等等。 def index(reqeust)...

Python实现列表删除重复元素的三种常用方法分析

本文实例讲述了Python实现列表删除重复元素的三种常用方法。分享给大家供大家参考,具体如下: 给定一个列表,要求删除列表中重复元素。 listA = ['python','语','...

详解Python中的条件判断语句

详解Python中的条件判断语句

 一个else语句可以使用if语句结合起来。如果在if语句中的条件表达式解析为0或false值,那么else语句包含代码执行。 else语句是可选的声明,并if语句下面最多只有...

由Python运算π的值深入Python中科学计算的实现

由Python运算π的值深入Python中科学计算的实现

π是一个无数人追随的真正的神奇数字。我不是很清楚一个永远重复的无理数的迷人之处。在我看来,我乐于计算π,也就是计算π的值。因为π是一个无理数,它是无限的。这就意味着任何对π的计算都仅仅是...