关键词:
区块链
纵向联邦学习
隐私集合求交
同态加密
安全性
去中心化
摘要:
纵向联邦学习支持在具有重叠样本的敏感参与者之间训练模型。在纵向联邦学习中,隐私集合求交协议用于从不同参与者的数据集中挑选出相同的样本ID,以进行联邦学习模型训练。然而,现有的隐私集合求交协议仅支持两个参与者之间以完全连接的方式进行加密ID对齐,多方参与时需要每对参与者之间建立完全连接,过程较为复杂。并且,现有纵向联邦学习中使用了中心化参数服务器来分发加密密钥和更新加密训练参数,因此容易成为单点攻击的目标从而产生不真实的训练参数和模型。针对上述问题,提出了区块链赋能的多方参与纵向联邦学习方案,支持多个参与者之间进行隐私训练。具体来说,提出了一种区块链赋能的多方隐私集合求交协议,采用两阶段加密ID对齐策略。此外,设计了一种随机密钥分发方法,并提出了一种区块链赋能的模型安全训练方案,其中包括随机掩码和训练梯度的同态加密聚合。实验表明,所提出的区块链赋能的纵向联邦学习方案中的隐私集合求交协议比现有的隐私集合求交协议执行速度提高了一倍以上,区块链赋能的模型训练结果在准确性上接近于中心化训练,区块链赋能的纵向联邦学习架构的鲁棒性也高于传统集中式机器学习,能够更好地应对节点离线等突发状况,持续完成模型训练迭代过程。