详解pandas删除缺失数据(pd.dropna()方法)

yipeiwu_com6年前Python基础

1.创建带有缺失值的数据库:

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three'])    # 随机产生5行3列的数据  
df.ix[1, :-1] = np.nan    # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan

print('\ndf1')    # 输出df1,然后换行
print(df)

查看数据内容:

2.通常情况下删除行,使用参数axis = 0,删除列的参数axis = 1,通常不会这么做,那样会删除一个变量。

print('\ndrop row')
print(df.dropna(axis = 0))

删除后结果:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

深入理解 Python 中的多线程 新手必看

示例1 我们将要请求五个不同的url: 单线程 import time import urllib2 defget_responses(): urls=[ ‘http...

Python中操作文件之write()方法的使用教程

 write()方法把字符串str写入文件。没有返回值。由于缓冲,字符串可能不实际显示文件,直到flush()或close()方法被调用。 语法 以下是write()方法的语法...

python滑块验证码的破解实现

python滑块验证码的破解实现

破解滑块验证码的思路主要有2种: 获得一张完整的背景图和一张有缺口的图片,两张图片进行像素上的一一对比,找出不一样的坐标。 获得一张有缺口的图片和需要验证的小图,两张图片进行二...

python实现简单的单变量线性回归方法

python实现简单的单变量线性回归方法

线性回归是机器学习中的基础算法之一,属于监督学习中的回归问题,算法的关键在于如何最小化代价函数,通常使用梯度下降或者正规方程(最小二乘法),在这里对算法原理不过多赘述,建议看吴恩达发布在...

Pandas DataFrame中的tuple元素遍历的实现

pandas中遍历dataframe的每一个元素 假如有一个需求场景需要遍历一个csv或excel中的每一个元素,判断这个元素是否含有某个关键字 那么可以用python的pandas库来...