基于随机森林算法对铜铝破碎料的识别方法
基于有色金属破碎料的外观差异,利用机器视觉代替人的视觉进行识别,是一种及时便捷、环保 有效的方法。在分选领域中,机器视觉被广泛应用于农产品以及电子元件的分选,研究主要集中在来源确定、形状规则的目标,对于从农业机械设 备、汽车拆解破碎得到的来源复杂、形状不规则、表面状态复杂的物料鲜有研究。采用自行设计的铜铝水箱粉碎机分选装置,基于机器视觉针对来源复杂、形状不规则、表面凹凸不平、多坑洼斑点的铜、铝破碎料进行分选研究,提取颜色和纹理等外观特征,并运用随机森林智能算法建立分类 器,为分类特征选择提供依据。
有效地从高维数据中提取或选择出有用的特征信息或规律,并将其分类识别已成为当今信息科学与技术所面临的基本问题。随机森林RF由Breima博士(2001)提出,是一种流行的机器学习算法。基于模型融合的理念来解决分类和拟合问题,利用自助重采样法bootstrap和节点随机分裂技术构建多棵决策树(多种不同分类器),并统计各个决策树投票结果得到终分类结果[13]。RF具有分析大型、高维数据的能力,不会出现过拟合,训练速度快,对于训练数据中的噪声和缺失数据具有良好的鲁棒性。其自身具有重要性度量能够对分类特征进行排序,从而进行特征选择。 训练过程中,根据决策树的数量,应用bootstrap 自助重采样方法有放回地随机抽取高维数据,创建 n个与训练集大小一致的样本集D1、D2,……,Dn用 于训练决策树。假设每个样本数据的维度为M(即 共M个特征),每棵决策树从随机选取的m(m≤M) 个特征子集中选择优特征的进行节点分裂,直到 得到终止结果或不再分裂为止。整个训练过程中不 进行剪枝。在测试过程中,所有训练完成的决策树 对测试集数据进行投票判断,根据多数投票原则选 出分类结果。其中,CART决策树通过独立的测试集 对训练集生成的决策树进行剪枝,从而获得每个决 策树的特征,也称为叶子节点。对测试集数据 的所有决策树叶子节点遍历求和,比较得到随机森 林的特征重要性度量。