6.5 随机森林算法概述

随机森林 指的是利用多棵树对样本进行训练并预测的一种分类器。该分类器最早由Leo Breiman和Adele Cutler提出,并被注册成了商标。随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而决定。顾名思义,随机森林是用随机的方式建立一个森林,森林由很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行判断,看看这个样本应该属于哪一类,然后看看哪一类被选择最多,则预测这个样本为那一类。不太严谨地讲,可以把随机森林当作加强版的决策树。