标签归档:randomForest

《R语言实战》第二版碎碎念之八:随机森林

随机森林(random forest)是一种组成式的有监督学习方法。随机森林的算法涉及对样本单元和变量进行抽样,从而生成大量决策树。对每个样本单元来说,所有决策树依次对其进行分类。所有决策树预测类别中的众数类别即为随机森林所预测的这一样本单元的类别。假设训练集中共有N个样本单元, M个变量。

1) 从训练集中随机有放回地抽取N个样本单元,生成大量决策树。

2) 在每一个节点随机抽取m<M[......]

Read more