关键词:
水质硬度检测
集成学习模型
健康风险评估
时空特征分析
模型服务化
摘要:
针对饮用水水质硬度检测与健康风险评估的关键问题,构建了融合原子吸收光谱法与EDTA(Ethylene Diamine Tetraacetic Acid,乙二胺四乙酸)滴定法的多源数据采集体系,提出了基于XGBoost-LightGBM混合集成学习模型的预测框架。设计SMOTE-Tomek组合采样算法解决数据不平衡问题,结合Shapley值解释模块量化特征交互效应。实验表明,模型在六大流域测试环境中平均RMSE(Root Mean Squared Error,均方根误差)降至9.6 mg/L,较传统方法提升48.7%,AUC-ROC(ROC曲线下的面积)达0.912,风险等级划分临床一致性Kappa系数为0.82。研究形成从数据采集、模型构建到风险评估的全链条解决方案,为智慧水务管理提供了技术支撑。