优点
1)训练速度快,容易做成并行化方法,训练时树与树之间是相互独立的
2)由于可以随机选择决策树节点划分特征,这样在样本特征维度很高的时候,仍然能高效的训练模型。
3)在训练完后,它能够给出哪些feature比较重要
4)由于采用了随机采样,训练出的模型的方差小,模型泛化能力强。
5)相对于Boosting系列的Adaboost和GBDT, RF实现比较简单。
6)对部分特征缺失不敏感。
缺点
1)在某些噪音比较大的样本集上,RF模型容易陷入过拟合。
2)对缺失值不敏感,如果有很大一部分的特征遗失,仍可以维持准确度