pandas.DataFrame选取/排除特定行的方法

yipeiwu_com6年前Python基础

pandas.DataFrame选取特定行

使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame,如果我们想要像Excel的筛选那样,只要其中的一行或某几行,可以使用isin()方法,将需要的行的值以列表方式传入,还可以传入字典,指定列进行筛选。

>>> df = pd.DataFrame([['GD', 'GX', 'FJ'], ['SD', 'SX', 'BJ'], ['HN', 'HB', 'AH'], ['HEN', 'HEN', 'HLJ'], ['SH', 'TJ', 'CQ']], columns=['p1', 'p2', 'p3'])
>>> df
  p1  p2  p3
0  GD  GX  FJ
1  SD  SX  BJ
2  HN  HB  AH
3 HEN HEN HLJ
4  SH  TJ  CQ
# 筛选p1列中值为'SD'和'HN'的行:
>>> df[df.p1.isin(['SD','HN'])]
  p1 p2 p3
1 SD SX BJ
2 HN HB AH

pandas.DataFrame排除特定行

但是,如果我们只想要所有内容中不包含特定行的内容,却并没有一个isnotin()方法。我今天的工作就遇到了这样的需求,经常查找之后,发现只能换种方式使用isin()来实现这个需求。

# 将p1转换为列表,再从列表中移除特定的行:
>>> ex_list = list(df.p1)
>>> ex_list.remove('SD')
>>> ex_list.remove('HN')
>>> df[df.p1.isin(ex_list)]
  p1  p2  p3
0  GD  GX  FJ
3 HEN HEN HLJ
4  SH  TJ  CQ

以上这篇pandas.DataFrame选取/排除特定行的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

利用Python+阿里云实现DDNS动态域名解析的方法

利用Python+阿里云实现DDNS动态域名解析的方法

引子 我想大家应该都很熟悉DNS了,这回在DNS前面加了一个D又变成了什么呢?这个D就是Dynamic(动态),也就是说,按照传统,一个域名所对应的IP地址应该是定死的,而使用了DDNS...

python如何以表格形式打印输出的方法示例

python如何以表格形式打印输出的方法示例

好久不见,风水轮流转,我竟然写写写python了 近日有个小需求,要求收集统计一些信息上报,并直接在后台控制台打印,写入日志 为了美观,需要以表格形式展现数据,形如 虽说可以用 pre...

Python之os操作方法(详解)

1. os.path.driname(path):返回路径的上一级路径字符串。   >>> os.path.dirname('D:\Games')   'D:\\'...

python查看列的唯一值方法

查看某一列中有多少中取值: 数据集名.drop_duplicates(['列名']) #实际为删除重复项,删除后对原数据集不修改 输入:data.drop_duplicates(['na...

python数据结构之线性表的顺序存储结构

用Python仿照C语言来实现线性表的顺序存储结构,供大家参考,具体内容如下 本文所采用的数据结构模板为 《数据结构教程》C语言版,李春葆、尹为民等著。 该篇所涉及到的是线性表的顺序存...