Python对数据进行插值和下采样的方法

yipeiwu_com6年前Python基础

使用Python进行插值非常方便,可以直接使用scipy中的interpolate

import numpy as np
x1 = np.linspace(1, 4096, 1024)
x_new = np.linspace(1, 4096, 4096)
from scipy import interpolate
tck = interpolate.splrep(x1, data)
y_bspline = interpolate.splev(x_new, tck)

其中y_bspline就是从1024插值得到的4096的数据

但是,scipy中好像并没有进行下采样的函数,嗯..难道是因为太过简单了么,不过好像用一个循环就可以完成,但如果把向量看成一个时间序列,使用pandas中的date_range模块也可以十分方便的以不同频率进行采样,并且,很多对文件的操作都是使用pandas操作的。

import pandas as pd
index = pd.date_range('1/1/2000', periods=4096, freq='T') #这个起始时间任意指定,freq为其频率
data = pd.read_table(filename, names=['feat'])
data.index = index
data_obj = data.resample('4T', label='right') #第一个为抽样频率,label表示左右开闭区间
data_new = data_new.asfreq()[0:]

因为data.resample返回的是一个 pandas.tseries.resample.DatetimeIndexResampler对象

所以想要获取其中的值可以通过 data_new.asfreq()[0:]获取

更多方法详见 pandas.DataFrame.resample

以上这篇Python对数据进行插值和下采样的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Python中functools模块的常用函数解析

1.partial 首先是partial函数,它可以重新绑定函数的可选参数,生成一个callable的partial对象: >>> int('10') # 实际上等...

Python并行分布式框架Celery详解

Python并行分布式框架Celery详解

Celery 简介 除了redis,还可以使用另外一个神器---Celery。Celery是一个异步任务的调度工具。 Celery 是 Distributed Task Queue,分...

Django分页查询并返回jsons数据(中文乱码解决方法)

一、引子 Django 分页查询并返回 json ,需要将返回的 queryset 序列化, demo 如下: # coding=UTF-8 import os from dj...

浅析python中的分片与截断序列

序列概念 在分片规则里list、tuple、str(字符串)都可以称为序列,都可以按规则进行切片操作 切片操作 注意切片的下标0代表顺序的第一个元素,-1代表倒序的第一个元素;且切片不...

python 检查数据中是否有缺失值,删除缺失值的方式

# 检查数据中是否有缺失值 np.isnan(train).any() Flase:表示对应特征的特征值中无缺失值 True:表示有缺失值 通常情况下删除行,使用参数axis =...