Python Pandas数据结构简单介绍

yipeiwu_com6年前Python基础

Series

Series 类似一维数组,由一组数据及一组相关数据标签组成。使用pandas的Series类即可创建。

import pandas as pd
s1 = pd.Series(['a', 'b', 'c,', 'd'])
print(s1)
#输出: 0   a 
#   1   b
#   2   c
#   3   d
#   dtype: object

上面是传入一个列表实现,上面的0,1,2,3就是数据的默认标签。另外可以通过index属性自定义标签。

s2 = pd.Series(['1', '2', '3,', '4'],index=['a', 'b', 'c,', 'd']) # index设置自定义索引
print(s2)

另外Series还可以通过字典传参。

s3 = pd.Series({'a':1,'b':2})
print(s3.values) # 通过values获取它的值

DataFrame

DataFrame是由一组数据和一组索引组成的数据结构,有行索引和列索引。和excel类似,是一种表格型数据结构。下面的就是一种简单的DataFrame数据格式

   技能 
 0  python 
 1  Java

DataFrame类中可传入列表实例化一个dataframe的表格数据对象,此时行和列索引默认都是0.常见的是传入嵌套的列表,嵌套的里面的列表也可以是元祖,如果不指定索引行列索引都是从0,1开始自增,并可以通过columns、index自定义的列索引和行索引。详见下面的代码。

import pandas as pd
df2 = pd.DataFrame([('a','A'),('b','B'),('c','C'),('d','D')]) # 传一个嵌套列表,嵌套里的数据可以是元祖,也可是列表
print(df2)

输出的格式如下:

  0   1 

0  a  A 

1  b  B 

2  c  C 

3  d  D
df3 = pd.DataFrame([('a','A'),('b','B'),('c','C'),('d','D')],columns=['小写','大写'])
print(df3)
  小写 大写 

0 a    A

1 b    B

2 c    C

3 d    D

DataFrame类中也可传入字典来实例化一个dataframe的表格数据对象,此时字典的key就相当于列索引,此时行索引默认还是从0开始,另外也可通过 index来自定义列索引。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python 读取excel文件生成sql文件实例详解

python 读取excel文件生成sql文件实例详解 学了python这么久,总算是在工作中用到一次。这次是为了从excel文件中读取数据然后写入到数据库中。这个逻辑用java来写的话...

Python实现的双色球生成功能示例

Python实现的双色球生成功能示例

本文实例讲述了Python实现的双色球生成功能。分享给大家供大家参考,具体如下: 最近学习Python的Random函数,就顺手写一个随机数的双色球程序,开发环境:python2.7 ,...

Python脚本实现格式化css文件

最近研究研究了css,少不了去网上分析一下别人的网页, 但很多网站的css文件都是要么写在一行,要么一个换行都没有,看起来极其痛苦,所以写一个脚本转换一下,转换为比较有可读性的格式。下面...

Python生成器(Generator)详解

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后...

Python操作rabbitMQ的示例代码

Python操作rabbitMQ的示例代码

引入 RabbitMQ 是一个由 Erlang 语言开发的 AMQP 的开源实现。 rabbitMQ是一款基于AMQP协议的消息中间件,它能够在应用之间提供可靠的消息传输。在易用性,扩展...