参考书目:贾俊平. 统计学——Python实现. 北京: 高等教育出版社,2021.
概率论里面的随机变量有很多分布,常见的离散型有二项分布,泊松分布,连续性的分布有正态分布,均匀分布,指数分等。分布是可以计算概率的,还有期望和方差。
首先看一个简单的加权的求期望和方差。
【Python统计学|Python统计学03——随机变量的概率分布】导入包,读取案例数据
import numpy as np
import pandas as pd
df=pd.read_csv('D:/AAA最近要用/贾老师/统计学—Python实现/(01)例题数据/pydata/chap04/example4_1.csv',encoding='gbk')
df.head()
文章图片
计算均值方差
mymean=sum(df['不合格品数']*df['概率'])
myvar=sum((df['不合格品数']-mymean)**2*df['概率'])
mystd=np.sqrt(myvar)
mymean,myvar,mystd
文章图片
二项分布
原理就不过多介绍了,学过概率论一个都会,这里主要介绍怎么用Python计算概率。
第一个参数表是时间成功的个数,第二个参数表是实验了多少次,第三个是成功的概率。
#二项分布
from scipy.stats import binom
p0=binom.pmf(0,5,0.06)
p1=binom.pmf(1,5,0.06)
p2=binom.pmf(2,5,0.06)
p3=binom.pmf(3,5,0.06)
p21=binom.cdf(3,5,0.06)#3个及其以下
print(p0+p1+p2+p3)
p0,p1,p2,p3,p21
文章图片
正态分布
#正态分布
from scipy.stats import norm
p1=norm.cdf(40,loc=50,scale=10)#p(x<40概率)
p2=norm.cdf(40,loc=50,scale=10)-norm.cdf(30,loc=50,scale=10)#p(30
文章图片
离散型概率分布的函数是pmf,连续性分布的概率密度是pdf,累计分布函数都是cdf。
还有ppf,表是反函,给概率返回值。
卡方分布
#卡方分布
from scipy.stats import chi2
p1=chi2.cdf(10,df=15)#自由度为15时,卡方小于10的概率
p2=1-chi2.cdf(15,df=25)#自由度为25时,卡方大于15的概率
q=chi2.ppf(0.95,df=10)#自由度为10 ,累计概率为0.95的反函值
print(p1,p2,q)
文章图片
t分布
#t分布
from scipy.stats import t
p1=t.cdf(-2,df=10)#自由度为10时,卡方小于-2的概率
p2=1-t.cdf(3,df=15)#自由度为25时,t大于3的概率
q=t.ppf(0.975,df=25)#自由度为25 ,累计概率为0.975的反函值
print(p1,p2,q)
文章图片
F分布
#F分布
from scipy.stats import f
p1=f.cdf(3,10,8)#自由度为10,8时,f小于3的概率
p2=1-f.cdf(2.5,18,15)#自由度为18,15时,f大于2.5的概率
q=f.ppf(0.95,dfn=25,dfd=20)#自由度为25,20 ,累计概率为0.95的反函值
print(p1,p2,q)
文章图片
推荐阅读
- 算法|opencvcv4.0
- 数据分析|Python数据分析29——seaborn可视化(五)之琴形图
- 「Python」面向对象封装案例1——小夏爱跑步、案例扩展(多个对象之间属性互不干扰)
- python|安装pytorch
- 深度学习|【深度学习-吴恩达】L1-4 深层神经网络
- 深度学习|2. 刘二大人《PyTorch深度学习实践》作业--梯度下降
- 连续学习|图解连续学习中的蓄水池抽样算法(The Illustrated Reservoir sampling)
- 我的教程|Python 快速规范代码
- 精简|精简 opencv python_01_opencv_python_基本图像处理