对pandas数据判断是否为NaN值的方法详解

yipeiwu_com6年前Python基础

实际项目中有这样的需求,将某一列的值,映射成类别型的数据,这个时候,需要我们将范围等频切分,或者等距切分。

具体的做法可以先看某一些特征的具体分布情况,然后我们选择合适的阈值进行分割。

def age_map(x):
 if x < 26:
  return 0
 elif x >=26 and x <= 35:
  return 1
 elif x > 35 and x <= 45:
  return 2
 elif pd.isnull(x): #判断是否为NaN值,== 和in 都无法判断
  return 3
 else:
  return 4

也就是用pandas自带的函数来表示:

pd.isnull(x) 

最后我们可以应用map函数:

data['age'] = data['birth_year'].map(age_map)

以上这篇对pandas数据判断是否为NaN值的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python with用法实例

python中with可以明显改进代码友好度,比如: 复制代码 代码如下: with open('a.txt') as f:      prin...

python3 pillow生成简单验证码图片的示例

使用Python的pillow模块 random 模块随机生成验证码图片,并应用到Django项目中 安装pillow $ pip3 install pillow 生成验证码图片...

Python 实现在文件中的每一行添加一个逗号

步骤1:读取每行(每行的类型是str) 步骤2:对每行列表化 步骤3:弹出每行的/n两个字符 步骤4:追加,/n三个字符 代码实现如下: #import os From_file=o...

200 行python 代码实现 2048 游戏

200 行python 代码实现 2048 游戏

创建游戏文件 2048.py 首先导入需要的包: import curses from random import randrange, choice from collection...

简单介绍python封装的基本知识

简单介绍python封装的基本知识

python封装简介 1.效果图:   对比一:   对比二: 2.学习来源代码: # 封装是面向对象的三大特性之一 # 封装指的是隐藏对象中一些不希望被外部所访问到的属性或方...