- 输出如下:
随机森林的特征
- 聚集许多决策树:随机森林是决策树的集合, 因此不依赖于单个功能, 而是将来自每个决策树的多个预测组合在一起。
- 防止过度拟合:在有多个决策树的情况下, 每棵树都抽取一个样本随机数据, 从而使随机森林具有比决策树更好的准确性。
- 高效:在大型数据库上执行时, 随机森林比决策树更有效率。
- 高度准确:随机森林具有很高的准确性, 因为它们是决策树的集合, 并且每个决策树都抽取样本随机数据, 结果, 随机森林在预测方面产生了更高的准确性。
- 有效的测试错误估计:即使数据丢失, 它也可以有效利用所有预测功能并保持准确性。
- 需要不同级别的数量:作为决策树的集合, 随机森林需要不同数量的级别才能对训练模型进行更加准确和有偏见的预测。
- 需要大量内存:训练大量树可能需要更高的内存或并行内存。
包装randomForest在R语言中, 编程用于创建随机森林。它构建的森林是决策树的集合。功能randomForest()用于创建和分析随机森林。
语法:例子:
randomForest(公式, 数据)
参数:
公式:表示描述要拟合的模型的公式
数据:表示包含模型中变量的数据框
要了解更多可选参数, 请使用命令help(" randomForest")
第1步:安装所需的软件包。
# Install the required package for function
install.packages ( "randomForest" )
第2步:加载所需的程序包。
# Load the library
library (randomForest)
第三步:在这个例子中,让我们使用R中显示的空气质量数据集。
# Print the dataset
print ( head (airquality))
输出如下:
Ozone Solar.R Wind Temp Month Day
1411907.46751
2361188.07252
312149 12.67453
418313 11.56254
5NANA 14.35655
628NA 14.96656
步骤4:创建随机森林进行回归
# Create random forest for regression
ozone.rf <
- randomForest (Ozone ~ ., data = https://www.lsbin.com/airquality, mtry = 3, importance = TRUE , na.action = na.omit)
步骤5:打印回归模型
# Print regression model
print (ozone.rf)
输出如下:
Call:
randomForest(formula = Ozone ~ ., data = https://www.lsbin.com/airquality, mtry = 3, importance = TRUE, na.action = na.omit)
Type of random forest: regression
Number of trees: 500
No. of variables tried at each split: 3Mean of squared residuals: 296.4822
% Var explained: 72.98
【R编程中的随机森林回归方法详细指南】步骤6:在误差与树数之间绘制图
# Output to be present as PNG file
png (file = "randomForestRegression.png" )# Plot the error vs the number of trees graph
plot (ozone.rf)# Saving the file
dev.off ()
输出如下:
文章图片
推荐阅读
- CSS高度和宽度(CSS样式编写)
- Java中的SortedSet接口及用法示例
- 如何从PHP中的URL字符串获取参数()
- SASS如何使用@if和@else(代码示例)
- 如何将PHP数组传递给JavaScript函数()
- 算法(如何查找可以用给定数字形成的最大数字())
- 算法(如何从排序的链表中删除所有重复项())
- AngularJS如何使用ng-class-odd指令(代码示例)
- 亚马逊面试体验分享|S432(关闭SDET –校园)