对pandas数据判断是否为NaN值的方法详解

yipeiwu_com5年前Python基础

实际项目中有这样的需求,将某一列的值,映射成类别型的数据,这个时候,需要我们将范围等频切分,或者等距切分。

具体的做法可以先看某一些特征的具体分布情况,然后我们选择合适的阈值进行分割。

def age_map(x):
 if x < 26:
  return 0
 elif x >=26 and x <= 35:
  return 1
 elif x > 35 and x <= 45:
  return 2
 elif pd.isnull(x): #判断是否为NaN值,== 和in 都无法判断
  return 3
 else:
  return 4

也就是用pandas自带的函数来表示:

pd.isnull(x) 

最后我们可以应用map函数:

data['age'] = data['birth_year'].map(age_map)

以上这篇对pandas数据判断是否为NaN值的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

老生常谈python之鸭子类和多态

一、 什么是多态 <1>一种类型具有多种类型的能力 <2>允许不同的对象对同一消息做出灵活的反应 <3>以一种通用的方式对待个使用的对象 <4&...

python框架django基础指南

Django简介: Django是一个开放源代码的Web应用框架,由Python写成。采用了MVC的框架模式,即模型M,视图V和控制器C。不过在Django实际使用中,Django更关注...

python买卖股票的最佳时机(基于贪心/蛮力算法)

python买卖股票的最佳时机(基于贪心/蛮力算法)

开始刷leetcode算法题 今天做的是“买卖股票的最佳时机” 题目要求 给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可...

python分数表示方式和写法

Fraction函数是python中实现分数的一个模块(module),模块是由别人写的,并且可以被拿来直接使用的代码程序,包括类、函数以及标签的定义,是python标准函数库的一部分。...

Python使用reportlab将目录下所有的文本文件打印成pdf的方法

本文实例讲述了Python使用reportlab将目录下所有的文本文件打印成pdf的方法。分享给大家供大家参考。具体实现方法如下: # -*- coding: utf8 -*- #...