关键词:
改进决策树算法
混合属性大数据
分类优化
C4.5算法
信息熵
信息增益率
摘要:
为了简化混合属性大数据的分类过程,并依据各类属性数据的内在特征,确保分类结果的准确性,文中提出了改进决策树算法的混合属性大数据分类优化方法。通过主成分分析法挖掘混合属性大数据之间的内在规律,提取混合属性大数据关键特征;构建基于C4.5算法的改进决策树算法分类模型,输入提取的关键特征,计算该特征的信息熵和信息增益率,采用动态调整的方式进行模式学习,实现动态修正信息熵,以此优化节点的分裂效果,从而进一步提升分类精准度,输出混合属性大数据分类结果。通过实验验证,该方法具有极高的精确度,能够清晰区分不同类别的数据,且性能稳定,分类效率更高、可靠性更强,能够有效抵御噪声对分类性能的不利影响,证明了所提方法实现混合属性大数据分类稳定性和可靠性。