python朴素贝叶斯分类器_Python机器学习笔记之——朴素贝叶斯分类器 python朴素贝叶斯分类器

朴素贝叶斯分类器
朴素贝叶斯分类器的训练速度比线性模型更快。这种高效率所付出的代价是，朴素贝叶斯模型的泛化能力要比线性分类器(如 LogisticRegression 和 LinearSVC)稍差。
朴素贝叶斯模型如此高效的原因在于，它通过单独查看每个特征来学习参数，并从每个特征中收集简单的类别统计数据。scikit-learn 中实现了三种朴素贝叶斯分类器：GaussianNB、BernoulliNB 和 MultinomialNB。GaussianNB 可应用于任意连续数据，而 BernoulliNB 假定输入数据为二分类数据，MultinomialNB 假定输入数据为计数数据(即每个特征代表某个对象的整数计数，比如一个单词在句子中出现的次数)。BernoulliNB 和 MultinomialNB 主要用于文本数据分类。
BernoulliNB 分类器计算每个类别中每个特征不为 0 的元素个数。用一个简单的例子来说明会很容易理解：
文章图片

【python朴素贝叶斯分类器_Python机器学习笔记之——朴素贝叶斯分类器】这里我们有 4 个数据点，每个点有 4 个二分类特征。一共有两个类别：0 和 1。对于类别 0(第 1、3 个数据点)，第一个特征有 2 个为零、0 个不为零，第二个特征有 1 个为零、1 个不为零，以此类推。然后对类别 1 中的数据点计算相同的计数。计算每个类别中的非零元素个数：
文章图片

另外两种朴素贝叶斯模型(MultinomialNB 和 GaussianNB)计算的统计数据类型略有不同。MultinomialNB 计算每个类别中每个特征的平均值，而 GaussianNB 会保存每个类别中每个特征的平均值和标准差。参数
MultinomialNB 和 GaussianNB 都只有一个参数 alpha，用于控制模型复杂度。alpha 的工作原理是，算法向数据中添加 alpha 这么多的虚拟数据点，这些点对所有特征都取正值。这可以将统计数据 “平滑化”(smooyhing)。alpha 越大，平滑性越强，模型的复杂度就越低。
优点
GaussianNB 主要用于高维数据，而另外两种朴素贝叶斯模型则广泛用于稀疏计数数据，比如文本。MultinomialNB 的性能通常会高于 BernoulliNB，特别是在包含很多非零特性的数据集(即大型文档)上。原作者姓名：前丨尘忆·梦
原出处：CSDN

python朴素贝叶斯分类器_Python机器学习笔记之——朴素贝叶斯分类器

推荐阅读

离群点分析应用,spss离群点分析

上海招聘网站有哪些上海招聘网站

win10电脑屏幕倒过来了解决方法

尼康AF-S DX 尼克尔 35mm f/1.8G 尼康afs1855

狗狗去抢年轻人的滑板玩，还知道助跑跳上去，这是在嘲讽人家吗？

u盘打开ghost,教您如何运用u盘打开盘自已手工ghost备份系统

减重记录2

同学生日送什么礼物好女大学同学生日送什么礼物好女

行车记录仪怎么安装走线行车记录仪怎么安装

iphone4|尼康衰落，iPhone背锅？

马齿苋会影响月经吗

软籽石榴吃了有什么好处

打卡Hello Kitty Sweet hellokitty主题餐厅

兴味怎么读拼音怎么写兴味怎么读

项目无法添加tomcat，如何修改项目的jdk版本，Java version 1.8 is not supported

菲斯曼锅炉怎么测算房间面积？

wav音乐在哪下载整轨的wav如何分割，wav整轨变分轨

小程序注册成功文案，小程序注册好了怎么开发

Flutter项目实战之Flutter_Gank

圣女果的保存方法圣女果的保存方式