Python Numpy库datetime类型的处理详解
前言
关于时间的处理,Python中自带的处理时间的模块就有time 、datetime、calendar,另外还有扩展的第三方库,如dateutil等等。通过这些途径可以随心所欲地用Python去处理时间。当我们用NumPy库做数据分析时,如何转换时间呢?
在NumPy 1.7版本开始,它的核心数组(ndarray)对象支持datetime相关功能,由于'datetime'这个数据类型名称已经在Python自带的datetime模块中使用了, NumPy中时间数据的类型称为'datetime64'。
单个时间格式字符串转换为numpy的datetime对象,可使用datetime64实例化一个对象,如下所示:
#时间字符串转numpy.datetime64 datetime_nd=np.datetime64('2019-01-01') print(type(datetime_nd))#<class 'numpy.datetime64'>
反过来numpy的datetime对象转换为时间格式字符串,可使用datetime_as_string()函数,如下所示:
#numpy.datetime64转时间字符串 datetime_str=np.datetime_as_string(datetime_nd) print(type(datetime_str))#<class 'numpy.str_'>
从时间格式字符串数组去创建numpy的datetime对象数组(array)时,可以直接使用numpy.array()函数,指定dtype为'datetime64',这样的话数组中的元素为'datetime64'类型,如下所示:
datetime_array = np.array(['2019-01-05','2019-01-02','2019-01-03'], dtype='datetime64') print(datetime_array)#['2019-01-05' '2019-01-02' '2019-01-03'] print(type(datetime_array))#<class 'numpy.ndarray'> print(type(datetime_array[0]))#<class 'numpy.datetime64'>
也可以通过numpy.arange()函数,给定时间起始范围去创建numpy的datetime对象数组(array),指定dtype为'datetime64'时默认以日为时间间隔,如下所示:
datetime_array = np.arange('2019-01-05','2019-01-10', dtype='datetime64') print(datetime_array)#['2019-01-05' '2019-01-06' '2019-01-07' '2019-01-08' '2019-01-09']
设定numpy.arange()函数中的dtype参数,可以调整时间的间隔,比如以年、月、周,甚至小时、分钟、毫秒程度的间隔生成时间数组,这点和Python的datetime模块是一样的,分为了date单位和time单位。如下所示:
# generate year datetime array datetime_array = np.arange('2018-01-01','2020-01-01', dtype='datetime64[Y]') print(datetime_array)#['2018' '2019'] # generate month datetime array datetime_array = np.arange('2019-01-01','2019-10-01', dtype='datetime64[M]') print(datetime_array)#['2019-01' '2019-02' '2019-03' '2019-04' '2019-05' '2019-06' '2019-07' '2019-08' '2019-09'] # generate week datetime array datetime_array = np.arange('2019-01-05','2019-02-10', dtype='datetime64[W]') print(datetime_array)#['2019-01-03' '2019-01-10' '2019-01-17' '2019-01-24' '2019-01-31'] # generate ms datetime array datetime_array = np.arange('2019-01-05','2019-01-10', dtype='datetime64[ms]') print(datetime_array) #['2019-01-05T00:00:00.000' '2019-01-05T00:00:00.001' # '2019-01-05T00:00:00.002' ... '2019-01-09T23:59:59.997' # '2019-01-09T23:59:59.998' '2019-01-09T23:59:59.999']
将numpy.datetime64转化为datetime格式转换为datetime格式,可使用astype()方法转换数据类型,如下所示:
#numpy.datetime64转化为datetime格式 datetime_df=datetime_nd.astype(datetime.datetime) print(type(datetime_df))#<class 'datetime.date'>
另外,numpy也提供了datetime.timedelta类的功能,支持两个时间对象的运算,得到一个时间单位形式的数值。因为numpy的核心数组(ndarray)对象没有物理量系统(physical quantities system),所以创建了timedelta64数据类型来补充datetime64。datetime和timedelta结合提供了更简单的datetime计算方法。如下所示:
# numpy.datetime64 calculations datetime_delta = np.datetime64('2009-01-01') - np.datetime64('2008-01-01') print(datetime_delta)#366 days print(type(datetime_delta))#<class 'numpy.timedelta64'> datetime_delta = np.datetime64('2009') + np.timedelta64(20, 'D') print(datetime_delta)#2009-01-21 datetime_delta = np.datetime64('2011-06-15T00:00') + np.timedelta64(12, 'h') print(datetime_delta)#2011-06-15T12:00 datetime_delta = np.timedelta64(1,'W') / np.timedelta64(1,'D') print(datetime_delta)#7.0
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。