关键词:
因果结构学习
线性非高斯
非纯”测量场景
变换独立噪声
摘要:
隐变量间的因果结构学习,核心在于从观测数据中挖掘隐变量彼此的因果关联,是科学研究中揭示现象本质的一种关键技术.现有方法普遍依赖“纯子”假设,即隐变量对应的观测子代变量(测量变量)间不存在直接的因果连接边,该假设在许多现实场景中往往无法成立,从而导致现有方法可识别性受限.针对该挑战,考虑“非纯”测量场景下的隐变量识别性问题,提出线性非高斯无环隐变量模型(linear non-Gaussian acyclic latent variable model, LiNGLM),该模型允许观测变量间存在因果关联.基于该模型,提出一种隐变量结构学习(latent variable structure learning, LLSTIN)算法,该算法基于变换独立噪声(transformed independent noise, TIN)条件及其建立的图准则,首先通过因果聚类构建(build causal cluster, BCC)算法提取各隐变量对应的“单因子集”来识别隐变量的存在,然后选取集合中的“根”观测变量作为隐变量的有效代理,进而识别隐变量间的因果关系.从理论上证明算法可正确提取单因子集并进一步识别隐变量因果结构,仿真数据与真实数据实验结果进一步验证所提算法的正确性和有效性.