包含python捷豹函数的词条( 三 )


风险评估
线性回归有助于评估涉及保险或金融领域的风险 。健康保险公司可以对每个客户的索赔数量与年龄进行线性回归分析 。这种分析有助于保险公司发现,老年顾客倾向于提出更多的保险索赔 。这样的分析结果在重要的商业决策中起着至关重要的作用,并且是为了解决风险 。
Python中的数据科学库实现线性回归 - statsmodel和SciKit
R中的数据科学库实现线性回归 - 统计
3.6 决策树机器学习算法
你正在制作一个周末计划 , 去访问最好的餐馆在城里 , 因为你的父母访问,但你是犹豫的决定在哪家餐厅选择 。每当你想去一家餐馆,你问你的朋友提利昂如果他认为你会喜欢一个特定的地方 。为了回答你的问题,提利昂首先要找出 , 你喜欢的那种餐馆 。你给他一个你去过的餐馆列表,告诉他你是否喜欢每个餐厅(给出一个标记的训练数据集) 。当你问提利昂你是否想要一个特定的餐厅R,他问你各种问题 , 如“是”R“屋顶餐厅?” , “餐厅”R“服务意大利菜吗?”,现场音乐?“,”餐厅R是否营业至午夜?“等等 。提利昂要求您提供几个信息问题,以最大限度地提高信息收益 , 并根据您对问卷的答案给予YES或NO回答 。这里Tyrion是你最喜欢的餐厅偏好的决策树 。
决策树是一种图形表示,其使用分支方法来基于某些条件来例示决策的所有可能的结果 。在决策树中,内部节点表示对属性的测试,树的每个分支表示测试的结果,叶节点表示特定类标签,即在计算所有属性之后作出的决定 。分类规则通过从根到叶节点的路径来表示 。
A.决策树的类型
(1)分类树 - 这些被视为用于基于响应变量将数据集分成不同类的默认种类的决策树 。这些通常在响应变量本质上是分类时使用 。
(2)回归树 - 当响应或目标变量是连续或数字时 , 使用回归树 。与分类相比,这些通常用于预测类型的问题 。
根据目标变量的类型 - 连续变量决策树和二进制变量决策树,决策树也可以分为两种类型 。它是有助于决定对于特定问题需要什么样的决策树的目标变量 。
【包含python捷豹函数的词条】B.为什么选择决策树算法?
(1)这些机器学习算法有助于在不确定性下作出决策 , 并帮助您改善沟通 , 因为他们提供了决策情况的可视化表示 。
(2)决策树机器学习算法帮助数据科学家捕获这样的想法:如果采取了不同的决策,那么情境或模型的操作性质将如何剧烈变化 。
(3)决策树算法通过允许数据科学家遍历前向和后向计算路径来帮助做出最佳决策 。
C.何时使用决策树机器学习算法
(1)决策树对错误是鲁棒的,并且如果训练数据包含错误 , 则决策树算法将最适合于解决这样的问题 。
(2)决策树最适合于实例由属性值对表示的问题 。
(3)如果训练数据具有缺失值,则可以使用决策树,因为它们可以通过查看其他列中的数据来很好地处理丢失的值 。
(4)当目标函数具有离散输出值时 , 决策树是最适合的 。
D.决策树的优点
(1)决策树是非常本能的,可以向任何人轻松解释 。来自非技术背景的人 , 也可以解释从决策树绘制的假设 , 因为他们是不言自明的 。
(2)当使用决策树机器学习算法时,数据类型不是约束,因为它们可以处理分类和数值变量 。
(3)决策树机器学习算法不需要对数据中的线性进行任何假设,因此可以在参数非线性相关的情况下使用 。这些机器学习算法不对分类器结构和空间分布做出任何假设 。

推荐阅读