蓝盟IT小贴士,来喽!
Yoshua Bengio等人在这篇论文中回顾了因果推理的基础概念,结合迁移和泛化等机器学习的重要开放性问题,分析了因果推理有可能为机器学习研究做出贡献。 反过来说,大多数因果研究的前提是因果变量。 因此目前AI和因果领域的中心问题是因果表征学习,即基于低级观测值发现高级因果变量。 最后,这篇论文描绘了因果对机器学习的影响,提出了这个交叉领域的核心研究方向。
这篇论文的主要贡献如下。
论文第2章介绍物理系统中因果建模的不同层次,第3章介绍因果模型和统计模型的不同。 这里不仅讨论了建模能力,还讨论了相关的假设和课题。
论文第4章将独立因果机制(Independent Causal Mechanisms,ICM )的原则作为根据数据推测因果关系的核心组件,即稀疏机制的转移(Sparse Mechanism Shift )的假设进行ichanisms
论文第五章回顾了基于现有合适的描述符(或特征)学习因果关系的方法,涵盖了经典方法和基于深度神经网络的现代方法,主要集中在促进因果发现的基础原则上。
论文第六章根据因果表示数据探讨学习有用模型的方法和从因果的角度探讨机器学习问题。
论文第七章分析了因果对实际机器学习的影响。 研究者用因果语言重新解释了鲁棒性和泛化、半监督学习、自我监督学习、数据增强、预训练等常见技术。 研究人员探讨了因果和机器学习在科学应用中的交叉领域,思考了如何将两者的优势结合起来,构建更通用的人工智能。
因果建模层次
独立分布设定下的预测
统计模型只是对关联进行建模,所以是对现实的粗糙描述。 对于输入样本x和目标标签y,可以近似P(Y |X )并回答以下问题: “这张照片中狗被包含的概率是多少?”在血压等规定的诊断和测量指标下,患者心力衰竭的概率是多少? “”。 在适当的假设下,这些问题可以通过基于P(X,y )观察足够量的独立同分布(i.i.d.)数据得到答案。
分布偏移下的预测
介入性问题(Interventional question )的行为超出了统计学习的独立分布设置,因此比预测更难。 “干预”(intervention )可能会影响因果变量子集的值及其关系。 例如,增加一个国家的鹳数量能促进人类出生率的增加吗? “如果香烟增加了社会污名化的色彩,吸烟的人会减少吗? “”回答违背事实的问题
反事实问题需要推理事件发生的原因,在事件发生后设想不同行为的结果,决定哪些行为可以达到预期的结果。 回答反事实问题比回答介入性问题要难。 但是,这对AI来说可能是一个重要的课题。 因为特工会从想象行动的结果,知道什么样的行动会带来特定的结果中受益。
数据的本质:观测、干预和(非)结构化
数据格式在推断关系类型中起着重要的作用。 可以判别数据模式的2个轴。 观测数据vs介入数据、手动工程数据vs原创(非结构化)感知输入。
观测和干预数据:大多数情况下是假设的,但很少严格得到的极端数据格式之一是观测独立同分布数据,各数据点独立从同一分布中采样。
手动工程数据和原始数据:在经典AI中,常常假设数据可以结构化为高级、有意义的变量,这可能部分对应于底层图的因果变量。
因果模型和推理
该部分主要介绍了统计建模和因果建模的区别,并用形式化语言介绍了干预和分布变化。
独立的同分布数据驱动的方法
对于独立的同分布数据,强通用性(universal consistency )保证了学习算法收敛到最低风险。 这种算法确实存在,如最近邻分类器、支持向量机、神经网络等。 但是,现在的机器学习方法通常在面临不适合独立同分布假设的问题时性能很差,但这样的问题对人类来说很简单。
文/上海蓝盟 IT外包专家