关键词:
弱标记
邻域条件熵
属性增加
增量式
属性约简
摘要:
弱标记不完备混合型决策系统的增量式属性约简问题是目前粗糙集领域的研究热点之一。本研究基于邻域条件熵,设计了一种适用于弱标记不完备混合型决策系统属性动态增加的增量式属性约简算法。首先,对传统的邻域条件熵模型进行改进,并以此提出了一种非增量式的静态属性约简算法;其次,结合增量式学习方法,构造了当属性动态增加时邻域条件熵的增量式更新机制,并利用具体实例理论验证了该机制的高效性;接着,根据构造的增量式机制,引入终止阈值,设计了一种相应的增量式属性约简算法;最后,从UCI上选取8个数据集,通过仿真实验进行参数寻优处理,并选取现有的两类属性约简算法从算法运行时间和分类性能两个方面和本文中所提算法进行对比分析。实验结果表明,最后一次增加属性集时,本研究的增量式算法2相较于其他算法在较小数据集Wine上的运行时间平均缩短了95.09%,在较大数据集German上的运行时间平均缩短了89.34%,整体分类精度平均约为0.789 1。本研究所提的增量式算法2在显著提高约简效率的同时,确保了良好的分类性能,具有一定的高效性和可行性。