李航《统计学习方法》拾遗-朴素贝叶斯李航《统计学习方法》拾遗-朴

记得之前在一次网易的笔试中，完全忘记了朴素贝叶斯的计算方法，这次决心要好好看一看，争取一遍就记住！
朴素贝叶斯是典型的生成模型，因此我们要估计的是X和Y的联合概率分布P(X,Y)，估计联合概率分布，可以用我们之前学到的条件概率，即
P(X=x|Y=ck) = P(X=x,Y=ck) / P(Y=ck)。这里，我们可以直接得到的就是P(Y=ck)，这被称为先验概率，在使用极大似然估计的情况下，我们可以认为样本集中每类出现的概率作为P(Y)的值，而P(X|Y)是随着X的特征数以及每种特征的取值的增加而增加的，假设有4个特征，没种特征有5个取值的话，那么X的可能取值有4^5种，这样的量级是指数级增加的，我们根本不可能直接估计，那么该如何估计呢？？朴素贝叶斯算法给出了一种近似的答案：

文章图片
【李航《统计学习方法》拾遗-朴素贝叶斯】这里用到的假设是条件独立性假设，个人理解就是X中每一维度的特征独立影响Y的取值，X的特征之间不会对Y产生交叉影响。
所以，根据条件独立性假设，在给定一个样本x的时候，我们可以估计它属于每一类的概率，从而选择概率最大的一种类别作为他的类别判定：

文章图片

还有一个问题，我们为什么通过将实例x归类为后验概率最大的类中，就是期望风险最小化呢？

文章图片

李航《统计学习方法》拾遗-朴素贝叶斯

推荐阅读

巧影APP怎么制作隐身人?

荣耀|不再低调，6.5寸全速屏+22.5W快充+后置三摄，价格感人！

异地恋见面怎么省钱异地恋见面如何省钱，异地恋见面如何省钱呢

天宫二号为什么坠毁了中国第一个牺牲的宇航员是谁

12123在线支付不了怎么回事 12123在线支付没反应

美的空调格力和海尔哪个好家用,大部分是这里有问题

Win7系统不能正常关机的解决方法|Win7系统不能正常关机的解决教程

Python全栈系列[更新中]|Python零基础入门篇 - 52 - 文件操作的避坑指南

婚姻里丈夫和妻子相敬如宾好吗？

勇猛的近义词是什么勇猛的近义词是啥

为什么氯化铝是共价化合物

移动来电提醒怎么设置移动呼叫转移13800短信呼

Android工程化开发这门学科的看法

让你轻松搞定打印机废墨问题 3153废墨垫更换清零技巧分享

理怎么组词汉字理怎么组词

戒烟必经三大阶段戒烟关键期

边牧剪指甲正确方法边牧指甲怎么剪

腊八节是几月几日的腊八节是几月几号哪一天

魅族18参数

长城炮尿素冻了怎么办长城炮的尿素冬天能冻住吗