Python求解正态分布置信区间教程

yipeiwu_com6年前Python基础

正态分布和置信区间

正态分布(Normal Distribution)又叫高斯分布,是一种非常重要的概率分布。其概率密度函数的数学表达如下:

置信区间是对该区间能包含未知参数的可置信的程度的描述。

使用SciPy求解置信区间

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

N = 10000
x = np.random.normal(0, 1, N)
# ddof取值为1是因为在统计学中样本的标准偏差除的是(N-1)而不是N,统计学中的标准偏差除的是N
# SciPy中的std计算默认是采用统计学中标准差的计算方式
mean, std = x.mean(), x.std(ddof=1)
print(mean, std)
# 计算置信区间
# 这里的0.9是置信水平
conf_intveral = stats.norm.interval(0.9, loc=mean, scale=std)
print(conf_intveral)

输出如下:

0.0033541207210673997 0.9986647964318905
(-1.639303291798682, 1.6460115332408163)

这里的-1.639303291798682是置信上界,1.6460115332408163是置信下界,两个数值构成的区间就是置信区间

使用Matplotlib绘制正态分布密度曲线

# 绘制概率密度分布图
x = np.arange(-5, 5, 0.001)
# PDF是概率密度函数
y = stats.norm.pdf(x, loc=mean, scale=std)
plt.plot(x, y)
plt.show()

这里的pdf()函数是Probability density function,就是本文最开始的那个公式

最后的输出图像如下,可以看到结果跟理论上的正太分布还是比较像的:

正态分布置信区间规律

函数曲线下68.268949%的面积在平均数左右的一个标准差范围内

函数曲线下95.449974%的面积在平均数左右两个标准差的范围内

函数曲线下99.730020%的面积在平均数左右三个标准差的范围内

函数曲线下99.993666%的面积在平均数左右四个标准差的范围内

以上这篇Python求解正态分布置信区间教程就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

利用Python的装饰器解决Bottle框架中用户验证问题

首先来分析下需求,web程序后台需要认证,后台页面包含多个页面,最普通的方法就是为每个url添加认证,但是这样就需要每个每个绑定url的后台函数都需要添加类似或者相同的代码,但是这样做代...

关于python pyqt5安装失败问题的解决方法

前言 最近在工作中遇到一个问题,python pyqt5在安装的时候居然提示失败了,无奈只能找解决的办法,发现网上有同样遇到这个问题的同学,所以就总结了解决的方法分享出来,下面话不多说了...

Python编程实现删除VC临时文件及Debug目录的方法

本文实例讲述了Python编程实现删除VC临时文件及Debug目录的方法。分享给大家供大家参考,具体如下: # *_* coding=gb2312 *-* import os imp...

Python strip lstrip rstrip使用方法

    注意的是,传入的是一个字符数组,编译器去除两端所有相应的字符,直到没有匹配的字符,比如: theString = 'saaaay&nb...

python打印直角三角形与等腰三角形实例代码

前言 本文通过示例给大家详细介绍了关于python打印三角形的相关,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧 1、直角三角形 #i控制行数j控制*的个数 fo...