(1)相同点
- 都是由多棵树组成
- 最终的结果都是由多棵树一起决定
(2)不同点
- 组成随机森林的树可以分类树也可以是回归树,而GBDT只由回归树组成
- 组成随机森林的树可以并行生成,而GBDT是串行生成
- 随机森林的结果是多数表决表决的,而GBDT则是多棵树累加之和
- 随机森林对异常值不敏感,而GBDT对异常值比较敏感
- 随机森林是通过减少模型的方差来提高性能,而GBDT是减少模型的偏差来提高性能的
- 随机森林不需要进行数据预处理,即特征归一化。而GBDT则需要进行特征归一化
(3)RF:
优点:
- 易于理解,易于可视化
- 不需要太多的数据预处理,即数据归一化
- 不易过拟合
- 易于并行化
缺点:
- 不适合小样本数据,只适合大样本数据
- 大多数情况下,RF的精度低于GBDT
- 适合决策边界的是矩阵,不适合对角线型
(4)GBDT
优点:
- 精度高
缺点:
- 参数较多,容易过拟合
- 不易并行化
上一题:如何对决策树进行剪枝?
下一题:LR的原理和Loss的推导
标签: gbdt、森林、多棵、随机、rf
笔试题
刷题
简历模板
AI算法
大数据
内推
内推: