pandas系列之DataFrame 行列数据筛选实例

yipeiwu_com6年前Python基础

一、对DataFrame的认知

DataFrame的本质是行(index)列(column)索引+多列数据。

为了简化理解,我们不妨换个思路…

现实中,为了简化对一件事物的描述,我们会选择几个特征。

例如,从(性别、身高、学历、职业、爱好..)等角度去刻画一个人,这些“角度”即为“特征”。

其中,不同的行表示不同的记录;列代表特征,不同记录因各个特征之间的差异而不同。

DataFrame默认索引是序号(0,1,2…),可以理解成位置索引。一般我们用id标识不同记录,不会改变index。但为了理解不同特征(列)含义,我们往往会重新指定column。

一些简易但不算严谨的理解是:

行列

行 – index – 记录 (一般沿用默认索引)

列 – column – 特征 (自定义索引)

索引

默认索引 – 序号 – 位置 – 方便索引但理解不易

自定义索引 – 特征名称 – 属性 – 便于理解

二、对dataframe进行行列数据筛选

import pandas as pd,numpy as np
from pandas import DataFrame
df = DataFrame(np.arange(20).reshape((4,5)),column = list('abcde'))

1.df[]&df. 选取列数据

df.a 
df[[‘a','b']]

2.df.loc[[index],[colunm]] 通过标签选择数据

不对行进行筛选时,[index]处填 : (不能为空),即df.loc[:,'a']表示选取a列全部数据。

df.loc[0,'a'] 
df.loc[0:1,[‘a','b']] 
df.loc[[0,2],[‘a','c']]

3.df.iloc[[index],[colunm]] 通过位置选择数据

不对行进行筛选时,同df.loc[],即[index]处不能为空。

df.iloc[0,0] 
df.iloc[0:1,1:3] 
df.iloc[[0,2],[1,3]]

4.df.ix[[index],[column]] 通过标签or位置选择数据

df.ix[]混合了标签和位置选择。需要注意的是,[index]和[column]的框内需要指定同一类的选择。
df.ix[[0:1],[‘a',3]]报错

以上这篇pandas系列之DataFrame 行列数据筛选实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

使用Python发送邮件附件以定时备份MySQL的教程

最近迁移了wordpress,系统升级为CentOS 6,很奇怪的一个问题,在原来CentOS 5.8下用的很正常的定时备份数据库并通过邮件发送的脚本不能发送附件,其他都正常,邮件内容也...

Python调用C语言的方法【基于ctypes模块】

本文实例讲述了Python调用C语言的方法。分享给大家供大家参考,具体如下: Python中的ctypes模块可能是Python调用C方法中最简单的一种。ctypes模块提供了和C语言兼...

python八皇后问题的解决方法

本文为大家分享了python八皇后问题的解决方法,供大家参考,具体内容如下 题目: 给定一个 N*N 正方形棋盘,在上面放置 N个棋子,又叫皇后,使每两个棋子都不在同一条横线上、竖线上...

在Python中实现shuffle给列表洗牌

在Python中实现shuffle给列表洗牌

如下所示: # Copyright (c)2018, 东北大学软件学院学生 # All rightsreserved # 文件名称:a.py # 作 者:孔云 #问...

PYTHON发送邮件YAGMAIL的简单实现解析

这篇文章主要介绍了PYTHON发送邮件YAGMAIL的简单实现解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 yagmail发送邮...