python中决策树函数 python决策树代码解读( 六 )


(3)CART 使用 Gini 系数作为变量的不纯度量 , 减少了大量的对数运算;
(4)CART 采用代理测试来估计缺失值,而 C4.5 以不同概率划分到不同节点中;
(5)CART 采用“基于代价复杂度剪枝”方法进行剪枝,而 C4.5 采用悲观剪枝方法 。
(1)决策树易于理解和解释 , 可以可视化分析 , 容易提取出规则
(2)可以同时处理分类型和数值型数据
(3)可以处理缺失值
(4)运行速度比较快(使用Gini的快于使用信息熵,因为信息熵算法有log)
(1)容易发生过拟合(集成算法如随机森林可以很大程度上减少过拟合)
(2)容易忽略数据集中属性的相互关联;
(3)对于那些各类别样本数量不一致的数据 , 在决策树中,进行属性划分时,不同的判定准则会带来不同的属性选择倾向 。
写在后面:这个专辑主要是本小白在机器学习算法学习过程中的一些总结笔记和心得,如有不对之处还请各位大神多多指正?。ü赜诰霾呤鞯募糁褂泻芏嗝挥懈愣笈靼琢嘶嵩俚ザ莱鲆黄芙徇眨?
参考资料链接:
1.
2.
3.
4.
5.
6.
7.
8.
【python中决策树函数 python决策树代码解读】python中决策树函数的介绍就聊到这里吧,感谢你花时间阅读本站内容 , 更多关于python决策树代码解读、python中决策树函数的信息别忘了在本站进行查找喔 。

推荐阅读