包含python捷豹函数的词条( 二 )


非线性SVM在非线性SVM中,不可能使用超平面来分离训练数据 。例如 , 用于面部检测的训练数据由作为面部的一组图像和不是面部的另一组图像(换句话说,除了面部之外的所有其他图像)组成 。在这种条件下,训练数据太复杂,不可能找到每个特征向量的表示 。将面的集合与非面的集线性分离是复杂的任务 。
B.使用SVM的优点
(1)SVM对训练数据提供最佳分类性能(精度) 。
(2)SVM为未来数据的正确分类提供了更高的效率 。
(3)SVM的最好的事情是它不对数据做任何强有力的假设 。
(4)它不会过度拟合数据 。
C.支持向量机的应用
(1)SVM通常用于各种金融机构的股票市场预测 。例如,它可以用来比较股票相对于同一行业中其他股票的表现的相对表现 。股票的相对比较有助于管理基于由SVM学习算法做出的分类的投资决策 。
(2)Python中的数据科学库实现支持向量机-SciKit学习,PyML,SVMStruct Python , LIBSVM
(3)R中的数据科学库实现支持向量机 - klar,e1071
3.4 Apriori机器学习算法
Apriori算法是无监督机器学习算法,其从给定数据集生成关联规则 。关联规则意味着如果项目A出现,则项目B也以一定概率出现 。生成的大多数关联规则采用IF_THEN格式 。例如,如果人们买了一个iPad,他们还买了一个iPad保护套 。为了得到这样的结论的算法,它首先观察购买iPad的人购买iPad的人数 。这样一来,比例就像100个购买iPad的人一样,85个人还购买了一个iPad案例 。
A.Apriori机器学习算法的基本原理:
如果项集合频繁出现,则项集合的所有子集也频繁出现 。
如果项集合不经常出现,则项集合的所有超集都不经常出现 。
B.先验算法的优点
(1)它易于实现并且可以容易地并行化 。
(2)Apriori实现使用大项目集属性 。
C.Apriori算法应用
检测不良药物反应
Apriori算法用于关于医疗数据的关联分析,例如患者服用的药物,每个患者的特征,不良的不良反应患者体验,初始诊断等 。该分析产生关联规则,其帮助识别患者特征和药物的组合 导致药物的不良副作用 。
市场篮子分析
许多电子商务巨头如亚马逊使用Apriori来绘制数据洞察 , 哪些产品可能是一起购买,哪些是最响应促销 。例如,零售商可能使用Apriori预测购买糖和面粉的人很可能购买鸡蛋来烘烤蛋糕 。
自动完成应用程序
Google自动完成是Apriori的另一个流行的应用程序 , 其中 - 当用户键入单词时 , 搜索引擎寻找人们通常在特定单词之后键入的其他相关联的单词 。
Python中的数据科学库实现Apriori机器学习算法 - 在PyPi中有一个python实现Apriori
数据科学库在R中实现Apriori机器学习算法 – arules
3.5 线性回归机器学习算法
线性回归算法显示了2个变量之间的关系,以及一个变量中的变化如何影响另一个变量 。该算法显示了在改变自变量时对因变量的影响 。自变量被称为解释变量 , 因为它们解释了因变量对因变量的影响 。依赖变量通常被称为感兴趣的因子或预测因子 。
A.线性回归机器学习算法的优点
(1)它是最可解释的机器学习算法之一 , 使得它很容易解释给别人 。
(2)它易于使用 , 因为它需要最小的调谐 。
(3)它是最广泛使用的机器学习技术运行快 。
B.线性回归算法应用
估计销售额
线性回归在业务中有很大的用途,基于趋势的销售预测 。如果公司每月的销售额稳步增长 - 对月度销售数据的线性回归分析有助于公司预测未来几个月的销售额 。

推荐阅读