Pandas之drop_duplicates:去除重复项方法

yipeiwu_com6年前Python基础

方法

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数

这个drop_duplicate方法是对DataFrame格式的数据,去除特定列下面的重复行。返回DataFrame格式的数据。

subset : column label or sequence of labels, optional 

用来指定特定的列,默认所有列

keep : {‘first', ‘last', False}, default ‘first' 

删除重复项并保留第一次出现的项

inplace : boolean, default False 

是直接在原来数据上修改还是保留一个副本

实验

以上这篇Pandas之drop_duplicates:去除重复项方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

解决python replace函数替换无效问题

python replace函数替换无效问题 str = "hello,china!" str.replace("hell","well") print(str) hello,C...

Python实现计算最小编辑距离

Python实现计算最小编辑距离

最小编辑距离或莱文斯坦距离(Levenshtein),指由字符串A转化为字符串B的最小编辑次数。允许的编辑操作有:删除,插入,替换。具体内容可参见:维基百科—莱文斯坦距离。一般代码实现的...

PyQt6在全新电脑怎么样安装

在全新的电脑上安装 PyQt6,你需要先确保你的电脑上已安装了 Python 和 pip(Python 的包管理器)。以下是详细的步骤指导: 1. 安装 Python访问 Python 官方网站 下...

利用django如何解析用户上传的excel文件

前言 我们在工作中的时候,会有这种需求:用户上传一个格式固定excel表格到网站上,然后程序负债解析内容并进行处理。我最近在工作中就遇到了,所以想着将解决的过程总结分享出来,方便大家参考...

python遍历一个目录,输出所有的文件名的实例

python 获取一个文件夹内(包括子文件夹)所有文件的名字和路径 import os dir = "e:\\" for root, dirs, files in os.walk(d...