python pandas cumsum求累计次数的用法

yipeiwu_com6年前Python基础

本文主要是针对 cumsum函数的一些用法。具体应用场景看下面的数据集。


第一列是userID,第二列是安装的时间,第三列是安装的次数。

我们现在想做一件事情。就是统计用户在某一天前累计的安装次数。

譬如,对userID为20的用户,问在16天前,其安装次数为多少? 答案应该是4次。用python的实现也很简单。

又譬如,userID为44在19天前安装的次数,那就应该是1+3+1+1=6次。

具体代码:(假设数据集为data)

由于是针对每个userID,所以是需要将userID划分一下(这个方法在组内排序的时候有提到,可以参考前面的文章)。

所以才有下面这一句

groupby(['userID'])

然后,分完组后需要统计的Times,所以就是下面这一句

data['Times'].groupby(['userID'])

最后,我们需要的是累加量,所以,用cumsum()这个函数。

data['sum_Times']=data['Times'].groupby(['userID']).cumsum()

用得到的结果放在一列。

最后得到结果如下:


可以从sum_Times这列看到,每一个值都是相应userID在前一行的累加值。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python使用os模块和fileinput模块来操作文件目录

os模块 在python编程中,我们会经常使用到文件和目录,这些操作python提供一个os模块,里面有很多操作文件和目录的函数. 下面介绍os的常用功能 1.获取当前路径 >...

用Python进行TCP网络编程的教程

用Python进行TCP网络编程的教程

Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。 客户端 大多...

Python安装Imaging报错:The _imaging C module is not installed问题解决方法

今天写Python程序上传图片需要用到PIL库,于是到http://www.pythonware.com/products/pil/#pil117下载了一个1.1.7版本的,我用的是Ce...

python中hasattr()、getattr()、setattr()函数的使用

python中hasattr()、getattr()、setattr()函数的使用

 引言:   在阅读源码时,有很多简写的形式,其中一个比较常用的就是getattr()用来调用一个类中的变量或者方法,相关联的hasattr()、getattr()、setat...

python实现mysql的读写分离及负载均衡

python实现mysql的读写分离及负载均衡

Oracle数据库有其公司开发的配套rac来实现负载均衡,目前已知的最大节点数能到128个,但是其带来的维护成本无疑是很高的,并且rac的稳定性也并不是特别理想,尤其是节点很多的时候。...