对DataFrame数据中的重复行,利用groupby累加合并的方法详解

yipeiwu_com6年前 (2020-03-06)Python基础

pandas读取一组数据，可能存在重复索引，虽然可以利用drop_duplicate直接删除，但是会删除重要信息。

比如同一ID用户，多次登录学习时间。要计算该用户总共‘'学习时间‘'，就要把重复的ID的‘'学习时间‘'累加。

可以结合groupby和sum函数完成该操作。

实例如下：

新建一个DataFrame，计算每个 id 的总共学习时间。其中 id 为one/two的存在重复学习时间。先利用 groupby 按照键 id 分组，然后利用sum()函数求和，即可得到每个id的总共学习时间。

DataFrame数据中的重复行,利用groupby累加合并

以上这篇对DataFrame数据中的重复行,利用groupby累加合并的方法详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

这一部分我们将探索 PyQt5 的事件和信号是如何在应用程序中实现的。 Events事件所有的GUI应用程序都是事件驱动的。应用程序事件主要产生自用户，但它们也可通过其他方法来产生，例...

该脚本是为了结合之前的编写的脚本，来实现数据的比对模块，实现数据的自动化！由于数据格式是定死的，该代码只做参考，有什么问题可以私信我！ CSV的数据格式截图如下： readDataTo...

python中的range函数取反序有两种方式第一种：先构建一个列表，然后对列表中的元素进行反转。例如： a=range(5) for i in reversed(a):...

π是一个无数人追随的真正的神奇数字。我不是很清楚一个永远重复的无理数的迷人之处。在我看来，我乐于计算π，也就是计算π的值。因为π是一个无理数，它是无限的。这就意味着任何对π的计算都仅仅是...

代码如下： #encoding:utf-8 fin = open('1.txt', 'r') ''' 建立正向索引: “文档1”的ID > 单词1：出现位置列表；单词2：...

宜配屋