将字典转换为DataFrame并进行频次统计的方法

yipeiwu_com6年前Python基础

首先将一个字典转化为DataFrame,然后以DataFrame中的列进行频次统计。

代码如下:

import pandas as pd
a={'one':['A','A','B','C','C','A','B','B','A','A'],
 'tao':['B','B','C','C','A','A','C','B','C','A'],
 'three':['C','B','A','A','B','B','B','A','C','D']}
b=pd.DataFrame(a)
b.describe()

b是转换后DataFrame,显示如表格:

 one tao three
0 A B C
1 A B B
2 B C A
3 C C A
4 C A B
5 A A B
6 B C B
7 B B A
8 A C C
9 A A D

频次统计如表格:

 one tao three
count 10 10 10
unique 3 3 4
top A C B
freq 5 4 4

其中count是总共变量数量,unique是每列有几个变量,top是频次最高的那个变量,freq是频次最高变量出现的频次。

以上这篇将字典转换为DataFrame并进行频次统计的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

对Python 文件夹遍历和文件查找的实例讲解

实例如下所示: # -*- coding: utf-8 -*- #to find where use the table on xxxxx xxxxxx production en...

ERLANG和PYTHON互通实现过程详解

最近开发 Erlang ,对其字符串处理能力无言至极,于是决定把它和python联合起来,打造一个强力的分布式系统,等将来需要系统级开发时,我再把 C++/C组合进来. 首先参考了 Er...

python Pandas库基础分析之时间序列的处理详解

前言 在使用Python进行数据分析时,经常会遇到时间日期格式处理和转换,特别是分析和挖掘与时间相关的数据,比如量化交易就是从历史数据中寻找股价的变化规律。Python中自带的处理时间的...

使用python 获取进程pid号的方法

保存为.py文件后 运行脚本在后面添加进程名称即可 比如:python proinfo.py qq 即可获取QQ的进程信息,注意不区分大小写 复制代码 代码如下:#-*- encodin...

Python Web框架Flask中使用百度云存储BCS实例

对于部署在百度应用引擎BAE上的项目,使用百度云存储BCS(Baidu Cloud Storage)是不错的存储方案。 百度云存储已有Python SDK,对它进行简单封装后,就可以直接...