有关决策树的误差分析

决策 Tree 分析提问时有哪些步骤?1.决策树的算法决策树的算法以树形结构表示数据分类的结果 。在决策 tree完美划分学习样本之前停止决策 tree的增长,决策 tree方法的关键步骤如下:1 .画决策 tree,而画决策 tree的过程,也是对未来各种可能发生的事件进行仔细思考和预测的过程 , 并用树形图来表达这些情况,Draw 。

1、 决策树剪枝(DecisionTreePruning 决策树剪枝是对生成的树进行简化 , 避免过拟合 。在决策 tree完美划分学习样本之前停止决策 tree的增长 。这种提前停止树木生长的方法称为预修剪法 。修剪是在构建决策树时执行的 。决策 tree的所有构造方法,只有在熵不能进一步减少的情况下,才会停止创建分支的过程 。为了避免过拟合,可以设置一个阈值,熵减少量小于这个阈值,即使熵可以进一步减少,分支创建也会停止 。

(1)作为叶节点或根节点被包括的样本的最小数量(2) 决策树的层数(3)在节点的经验熵小于某个阈值之后进行修剪 。在决策树生长完成后进行剪枝,得到决策的简化版 。后期修剪是目前最常见的做法 。后剪枝的剪枝过程是删除一些子树,然后用它们的叶节点替换 。由该叶节点标识的类别由多数原则确定 。

2、规则、 决策树和森林如果森林中的一棵树倒下了,但是没有人听到,它发出声音了吗?规则是一种以易于理解的方式组合知识模块的方法 。如果“客户有钱”,那么“他就会买我的产品” 。如果“体温超过37摄氏度”,那么“此人有病” 。决策规则广泛应用于医疗、银行、保险等领域,以及与客户打交道的具体流程中 。在一个规则中,人们区分前因或前提(一系列测试)和前因或结论 。

通常,这些前提是由“与”连接的,也就是说,如果我们要“推出”这个规则,也就是得到一个结论,那么所有的测试都必须通过 。如果“距离不到2英里”,“天气晴朗”,那就“走” 。测试可以针对类型变量的值(“晴天”)或对数值变量进行简单运算的结果(“距离小于2英里”) 。如果你想让人们明白,计算必须简单 。一个切实可行的改进是在同一个句子中加入前提为假时的分类 。
【有关决策树的误差分析】

    推荐阅读