- 首页 > it技术 > >
文章图片
频率学派和贝叶斯学派
|
频率学派 |
贝叶斯学派 |
概率的定义 |
事件重复若干次后频率的极限 |
事件发生的不确定程度 |
判别方法 |
没有先验概率;要求事件是可重复的 |
有先验概率 |
描述不确定程度 |
置信区间或p值 |
后验概率 |
求解方法(测量全世界大学生的平均身高) |
认为这是一个确定值,用极大似然估计求解 |
认为不同值都有一个概率,用贝叶斯定理求解后验概率 |
条件概率的来源
- 除了逻辑学中正误确定的论断,还应考虑有不确定可信度的论断。类似于\(B\rightarrow A\)的逻辑推断,当我们得到新信息时,相关论断的可信度也应发生变化。比如,对于\(B\rightarrow A\),当\(B\)的可信度提高时,\(A\)也应该提高(条件概率);当\(A\)的可信度提高时,有时\(B\)也会提高(贝叶斯方法)
- 推导出唯一概率系统的考克斯公理
文章图片
- 概率论是常识推断的定量表述
? 类比逻辑论断\(B\rightarrow A\),先验概率\(P(B)\)为假设\(B\)成立的概率,条件概率\(P(A|B)\)为推断“\(\rightarrow\)”成立的概率,联合概率\(P(\mathbf{A}, \mathbf{B})\)为两个假设同时成立的概率
- 条件概率的计算式来源
- 根据第三条公理可知,联合事件发生的概率是由单一事件概率与条件概率决定的
- 直观上来看,\(P(A|B)\)与\(P(B)\)越大,联合事件发生的概率越大
- 乘法能保证概率值始终在\([0,1]\)区间
- 因此有\(P(\mathbf{A}, \mathbf{B})=P(\mathbf{A} \mid \mathbf{B}) P(\mathbf{B})\)
贝叶斯公式
- 核心:利用变量间的相关性,用新得到的可观测变量的信息来更新对不可观测变量的估计
- 当某一观测变量发生后,另一不可观测量的发生概率如何发生改变
- 更新前的估计就是先验概率
- 举例
|
不可观测量\(A\) |
可观测量\(B\) |
正向概率 \(P(B\mid A)\) |
逆向概率 \(P(A\mid B)\) |
发动机 |
发动机是不是坏了 |
声音不对 |
坏了过后的声音是不是这个声音? |
听到这个声音,发动机是不是坏了? |
抽球 |
盒子中不同颜色小球的比例 |
摸出小球的颜色 |
摸出小球可能是什么颜色? |
盒中小球的颜色比例? |
女神 |
女神是否喜欢你 |
女神对你笑 |
女神喜欢你的话,对你笑的概率有大? |
女神如果对你笑了,喜欢你吗? |
- 公式:\(P(A \mid B)= \frac{P(B \mid A)P(A)}{P(B)}\)
可以理解为\(P(A,B) = P(A \mid B)P(B)=P(A)P(B \mid A)\),同一相关关系的不同描述角度
文章图片
- 求解:
【【读书笔记】贝叶斯原理】以女神为例,要计算\(P(A \mid B)\),带入公式计算其余各项即可
- \(P(A)\):女神之前就喜欢你吗?如果是路人,还是设置为50%的概率吧
- \(P(B|A)\):喜欢一个人大概率会笑吧,可以设置为60%
- \(P(B)\):女神平时傻笑吗?高冷的话可以设置为40%
计算后可得,喜欢你的先验概率提升为75%了!感谢贝叶斯!
贝叶斯公式的应用
- 垃圾邮件筛选(垃圾邮件、敏感字词)
- 疾病检测(得病,报告)
- 贝叶斯方法可能是解决小样本学习的关键方法
推荐阅读