spark dataframe 将一列展开,把该列所有值都变成新列的方法

yipeiwu_com6年前 (2020-03-06)Python基础

The original dataframe

spark dataframe 将一列展开,把该列所有值都变成新列

需求：hour代表一天的24小时，现在要将hour列展开，每一个小时都作为一个列

实现：

val pivots = beijingGeoHourPopAfterDrop.groupBy("geoHash").pivot("hour").sum("countGeoPerHour").na.fill(0)

并且统计了对应的countGeoPerHour的和，如果有些行没有这个新列对应的数据，将用null填充

The new dataframe

spark dataframe 将一列展开,把该列所有值都变成新列

以上这篇spark dataframe 将一列展开,把该列所有值都变成新列的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持【听图阁-专注于Python设计】。

返回列表

约定： import pandas as pd DataFrame对象的列和索引之间的转化我们常常需要将DataFrame对象中的某列或某几列作为索引，或者将索引转化为对象的...

前言 pyinstaller能够在Windows、Linux等操作系统下将Python脚本打包成可直接运行程序。使Python脚本可以在没有安装Python的环境中直接运行，...

为什么会报错“UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not...

使用命令行时，如果要添加选项的话，python 2.3里新增加了一个模块叫optparse，也是专门来处理命令行选项的。复制代码代码如下: from optparse import...

将视图与缓存系统进行了耦合，从几个方面来说并不理想。例如，你可能想在某个无缓存的站点中重用该视图函数，或者你可能想将该视图发布给那些不想通过缓存使用它们的人。解决这些问题的方法是在...

宜配屋