包含python捷豹函数的词条

机器学习有哪些算法朴素贝叶斯分类器算法是最受欢迎的学习方法之一,按照相似性分类,用流行的贝叶斯概率定理来建立机器学习模型,特别是用于疾病预测和文档分类 。它是基于贝叶斯概率定理的单词的内容的主观分析的简单分类 。
什么时候使用机器学习算法 - 朴素贝叶斯分类器?
(1)如果您有一个中等或大的训练数据集 。
(2)如果实例具有几个属性 。
(3)给定分类参数,描述实例的属性应该是条件独立的 。
A.朴素贝叶斯分类器的应用
(1)情绪分析 - 用于Facebook分析表示积极或消极情绪的状态更新 。
(2)文档分类 - Google使用文档分类来索引文档并查找相关性分数 , 即PageRank 。PageRank机制考虑在使用文档分类技术解析和分类的数据库中标记为重要的页面 。
(3)朴素贝叶斯算法也用于分类关于技术,娱乐,体育,政治等的新闻文章 。
(4)电子邮件垃圾邮件过滤 - Google Mail使用Na?veBayes算法将您的电子邮件归类为垃圾邮件或非垃圾邮件 。
B.朴素贝叶斯分类器机器学习算法的优点
(1)当输入变量是分类时,朴素贝叶斯分类器算法执行得很好 。
(2)当朴素贝叶斯条件独立假设成立时,朴素贝叶斯分类器收敛更快,需要相对较少的训练数据,而不像其他判别模型,如逻辑回归 。
(3)使用朴素贝叶斯分类器算法,更容易预测测试数据集的类 。多等级预测的好赌注 。
(4)虽然它需要条件独立假设,但是朴素贝叶斯分类器在各种应用领域都表现出良好的性能 。
Python中的数据科学库实现Na?veBayes - Sci-Kit学习
数据科学图书馆在R实施朴素贝叶斯 - e1071
3.2 K均值聚类算法
K-means是用于聚类分析的普遍使用的无监督机器学习算法 。K-Means是一种非确定性和迭代的方法 。该算法通过预定数量的簇k对给定数据集进行操作 。K Means算法的输出是具有在簇之间分割的输入数据的k个簇 。
例如,让我们考虑维基百科搜索结果的K均值聚类 。维基百科上的搜索词“Jaguar”将返回包含Jaguar这个词的所有页面 , 它可以将Jaguar称为Car , Jaguar称为Mac OS版本,Jaguar作为动物 。K均值聚类算法可以应用于对描述类似概念的网页进行分组 。因此,算法将把所有谈论捷豹的网页作为一个动物分组到一个集群,将捷豹作为一个汽车分组到另一个集群,等等 。
A.使用K-means聚类机学习算法的优点
(1)在球状簇的情况下 , K-Means产生比层级聚类更紧密的簇 。
(2)给定一个较小的K值,K-Means聚类计算比大量变量的层次聚类更快 。
B.K-Means聚类的应用
K Means Clustering算法被大多数搜索引擎(如Yahoo,Google)用于通过相似性对网页进行聚类 , 并识别搜索结果的“相关率” 。这有助于搜索引擎减少用户的计算时间 。
Python中的数据科学库实现K均值聚类 - SciPy , Sci-Kit学习,Python包装
数据科学库中的R实现K均值聚类 - 统计
3.3 支持向量机学习算法
支持向量机是一种分类或回归问题的监督机器学习算法,其中数据集教导关于类的SVM,以便SVM可以对任何新数据进行分类 。它通过找到将训练数据集分成类的线(超平面)将数据分类到不同的类中来工作 。由于存在许多这样的线性超平面,SVM算法尝试最大化所涉及的各种类之间的距离,并且这被称为边际最大化 。如果识别出最大化类之间的距离的线,则增加对未看见数据良好推广的概率 。
A.SVM分为两类:
线性SVM - 在线性SVM中,训练数据,即分类器由超平面分离 。

推荐阅读