橘智橘智
偶是大橘子哇
预计阅读时间:7分钟9秒

因果推断的哲学基础

超越相关性的因果性

0
0

原作者:Outis


对休谟式规律性解释与纯概率因果观的批判

传统的休谟式因果规律理论可以追溯到大卫·休谟的经验主义分析。它将因果关系还原为经验中所观察到的事件类型之间的恒常接续:一种类型的事件总是无例外地跟随着另一种类型的事件出现。然而,这一观点存在根本性的局限,因为它无法区分真正的因果关系与偶然的规律性,也无法排除那些由于共同原因或有限数据中的巧合模式而产生的虚假相关。


纯概率性的因果观——例如二十世纪中叶发展出的那些理论——试图对规律性理论加以修正,将因果关系界定为概率依赖,或者界定为某一原因提高某一结果发生的概率。但这些理论在面对过度决定、抢先因果(preemption)以及并不体现方向性影响的对称性概率依赖时,同样难以成立。它们无法可靠地区分因果机制与单纯的统计关联,因为这些理论缺乏对“干预”或“反事实依赖”的明确表征。


因果推断传统中的哲学家,包括 Peter Spirtes 及其合作者,系统性地批判了这些框架,指出它们无法支持操控条件下的预测,也无法消解观察数据中的歧义。如果没有一种形式化装置来编码:当一个变量被改变、而背景条件保持固定时,其他变量会如何随之变化,那么规律性理论和概率理论就始终只能停留在对模式的描述上,而无法进入解释性结构之中。


正是这种哲学上的不足,推动了理论转向一种以计算为基础的模型:它将因果性视为一种能够在明确假设之下通过算法搜索而恢复出来的关系。如此一来,因果理论便超越了早期经验主义传统的描述性局限,进而能够对“如果我们主动改变某一变量,会发生什么”这一问题进行严格推断。


关联、预测与真正因果性的区分

现代因果推断哲学基础中的一个核心支柱,在于对单纯关联、预测建模与真正因果主张之间所作出的严格区分。所谓关联,是指数据中可观察到的统计依赖,例如变量之间的相关性;但这种相关性可能源自直接联系、共同原因,或者选择偏差,因此它本身并不提供任何关于“可操控性”的洞见。


预测建立在关联之上,它根据已观察到的模式对结果进行预估,因此能够在同一分布下较准确地预测未来取值;但一旦底层的数据生成过程因外部干预而发生改变,预测模型便会失效。与之相反,真正的因果关系所刻画的是:一个变量如何以一种在假设性操控之下仍然成立的方式影响另一个变量。它支持反事实推理,即询问:如果某个原因变量被独立于其自然决定因素地设定为某一特定值,那么结果将会如何。


这种三分法揭示了为何仅凭观察性相关无法为政策建议或科学解释提供正当根据,因为后者要求我们知道干预效应。在哲学意义上,关联与预测属于被动观察的领域,而因果则要求一种与变化之下的不变性相关联的主动性概念。


Spirtes、Glymour 和 Scheines 在其奠基性工作中强调了这种区分。他们指出,关联可以直接从概率分布中读出,而因果结构则需要额外的关于独立性关系与图模型表征的假设。历史上,未能严格维持这种区分,曾导致流行病学、经济学与社会科学中的大量错误推断:混杂变量常常伪装成真正的因果驱动因素。


通过图模型与干预框架将这三者之间的差距形式化,因果推断哲学为我们提供了超越相关分析、迈向关于机制与效应的稳健主张的工具。


有向无环图(DAG)与图形因果模型的引入

有向无环图(directed acyclic graphs, DAGs)是因果推断哲学基础中的一项关键创新。它提供了一种形式语言,用以编码变量之间的因果结构,同时又与概率约束保持一致。在 DAG 中,节点对应随机变量,定向边表示从父节点到子节点的直接因果影响,而“无环性”则保证在基本表征中不存在反馈回路。


这些图通过马尔可夫条件(Markov condition)来编码条件独立关系:每个变量在给定其父节点的条件下,都独立于其非后代节点。借助 d-分离(d-separation)准则,人们可以从模型中推出可检验的蕴涵。图形因果模型则将这一形式主义进一步扩展:它不再仅仅将 DAG 理解为统计摘要,而是把它解释为对底层机制的表征,说明干预如何沿着系统传播。


图模型的引入,为长期以来围绕因果本体论的哲学争论提供了一个数学上精确的解决方式。它使我们能够区分那些在观察上等价、但在因果结构上不同的模型,并进一步识别哪些因果主张能够从数据中被辨识出来。Spirtes 及其同事表明,DAG 能够支持算法化的发现程序:这些程序搜索与已观察到的独立性关系相一致的图之等价类,从而将因果推理操作化,使其成为哲学、统计学与计算之间的交汇点。


与早期仅靠语言描述或方程表达的方法不同,DAG 具有视觉透明性,并且能够扩展到高维问题,因此在随机实验不可行的领域中尤其不可或缺。其哲学意义在于,它能够把关于依赖性的抽象概念,与关于观察分布和干预分布的具体、可检验预测连接起来,从而将因果性确立为一种在最少背景知识下也可恢复的关系性质。


因果发现中的忠实性与极小性假设

因果发现算法依赖两个基石性假设:忠实性(faithfulness)与极小性(minimality)。这两个假设确保:所观察到的概率分布能够忠实反映底层因果图,而不会因额外的独立性或不必要的边而扭曲。

忠实性假设主张:概率分布对于因果结构是忠实的。也就是说,图通过 d-分离所蕴涵的、并且仅蕴涵的那些条件独立关系,才会真实地出现在数据中。这个假设排除了偶然抵消或参数微调导致的虚假独立性。极小性假设则要求图中不存在多余的边,从而保证在与独立性关系一致的前提下,模型是尽可能稀疏的。


这两个假设共同使得约束型搜索程序——例如 PC 算法——能够仅从观察数据中系统地定向边并恢复因果方向。从哲学上看,忠实性回应了“欠决定性”问题,因为它保证统计模式能够可靠地映照因果机制;极小性则与奥卡姆剃刀一致,偏向更简单的解释。


如果没有忠实性,发现方法可能会遗漏真正的因果联系,或者推断出并不存在的联系;如果没有极小性,推断将不断产生等价却不必要复杂的模型。Spirtes 及其合作者对这些假设的含义进行了严格分析,在这些假设之下证明了算法的可靠性与完备性结果,并探索了更弱版本,以增强方法对假设违背情形的鲁棒性。


因此,这些假设并不仅仅是技术性的,它们还承载着深刻的认识论意义:它们把科学家对于这样一个世界的承诺形式化了——在这个世界中,因果关系能够在数据中以相对透明的方式显现出来。就实践而言,它们使因果推断得以从哲学推进为算法,通过提供区分复杂数据中信号与噪音所需的逻辑支架。


与早期因果哲学工作的关系(Reichenbach、Suppes、Salmon)

图形化因果推断方法直接建立在 Hans Reichenbach、Patrick Suppes 与 Wesley Salmon 等人早期哲学贡献之上。它将他们的思想整合进一个统一的形式框架,同时也克服了其局限性。


Reichenbach 的共同原因原则与“筛除”(screening-off)条件,为 DAG 中的马尔可夫条件提供了直观基础:事件之间的相关性可以通过一个共同原因来解释,而这个共同原因会使它们在条件化之后变得独立。Suppes 推进了一种概率性因果理论,认为原因是在时间上先于结果、并提高结果概率的事件;但这一理论难以处理虚假关联,也缺乏多变量系统中的图形表征。Salmon 则强调因果过程与机制,主张通过连续的时空互动来区分真正的生成与单纯的相关;不过,这种观点仍然较为定性。


现代图模型综合了这些传统:它将 Reichenbach 的筛除思想嵌入 d-分离框架,将 Suppes 式的概率提升纳入 do-干预,并通过有向路径来刻画 Salmon 所强调的机制性生成。Spirtes、Glymour 与 Scheines 也明确承认这些前驱的贡献,并展示了 DAG 如何通过区分直接效应与间接效应、并提供关于推断的完备性定理,来消解概率因果理论中的歧义。


这种关系意味着,早期哲学分析已从描述性的启发法转化为算法发现的公理化基础,使因果主张既能被经验检验,又保留了关于时间、概率与机制的核心直觉。这种连续性也表明,所谓“因果革命”并非凭空出现,而是二十世纪科学哲学在计算能力加持下走向成熟的结果。


Spirtes 早期关于“因果推断作为哲学问题”的论文

Peter Spirtes 的早期论文将因果推断确立为一个独特的哲学问题。他把从统计数据中发现因果结构这件事,界定为一项认识论挑战:它既要求形式上的严格性,也要求对科学实践保持敏感。


在二十世纪八十年代末以来的一系列工作中——包括诸如 Causality from Probability 这样的合作技术报告——Spirtes 探讨了哲学家如何超越传统的理论确认问题,发展出在不确定性条件下自动推断因果关系的程序。这些论文并未把因果性视为一个形而上学原始项,而是将其视为一种嵌入在概率分布之中、并可通过条件独立关系加以检验的关系。它们一方面继承了逻辑经验主义传统,另一方面又引入了模型搜索的计算启发式方法。


Spirtes 之所以认为因果推断是一个哲学问题,是因为它触及了一系列根本议题:欠决定性、背景知识如何纳入、以及观察性证据在区分真正机制与伪象时的极限。通过分析玩具模型和真实科学案例,他的早期研究凸显了纯关联统计的不足,并主张采用一种混合方法:将科学哲学与人工智能技术结合起来。

这些工作为后来系统性的论著奠定了基础,因为它们表明:对于因果概念的哲学澄清,能够导向处理潜在变量与选择偏差的实用算法。Spirtes 的方法尤其强调,因果发现本质上是一项规范性工作:它要求对假设作出明确辩护,并对方法可靠性进行评估。因此,这一领域被定位为抽象认识论与科学中的应用方法论之间的一座桥梁。


Pearl 的 do-calculus 与新兴因果推断共同体的影响

Judea Pearl 的 do-calculus 的发展,对因果推断的哲学基础产生了深远影响。它提供了一种精确的数学语言,用于表达干预与反事实,从而补充并加速了 Spirtes 及其同事所开创的约束型方法。


do-算子通过切断图中指向某变量的所有入边,将假设性的操控形式化,从而使研究者能够在可辨识条件下,直接从观察数据中计算干预分布。这一创新解决了关于因果语义的诸多哲学难题:它通过结构方程与图形“手术”的方式,为反事实奠定了基础,并由此将原本分散的传统统一于一个框架之中。


Pearl 的工作与 Spirtes 的努力大体并行,共同催生了一个充满活力的跨学科共同体,将哲学、统计学、计算机科学与流行病学连接起来。这个新兴的因果推断共同体——在应用层面还包括 Miguel Hernán 与 James Robins 等人物——通过会议、联合出版物以及诸如 TETRAD 之类的软件工具,促进了思想交叉与方法改进,并将研究拓展到时变处理与反事实公平性等议题。


从哲学上说,Pearl 的 do-calculus 强化了干预主义立场。它表明,因果性并不止于概率关系,而是关乎“在有意改变之下会发生什么”,因此它也深刻影响了关于解释、责任与政策的讨论。这个共同体的壮大,使原本相对孤立的哲学探究,转变为一个成熟的研究纲领;在这一纲领中,图模型与 do-calculus 成为跨学科严谨提出因果主张的共同语言。


这一集体性的推进说明:那些曾经显得抽象的哲学基础,如今已经成为数据驱动科学的支柱,因为它们赋予研究者区分相关与因果的工具,使其得以在大数据与观察性研究时代进行真正的因果分析。


Reference

Spirtes, P. (1989). Causality from probability. Technical Report, Carnegie Mellon University.


Spirtes, P., Glymour, C., & Scheines, R. (2000). Causation, Prediction, and Search (2nd ed.). MIT Press. (Chapters 1–3).


Pearl, J. (2009). Causality: Models, Reasoning, and Inference (2nd ed.). Cambridge University Press.


Hernán, M. A., & Robins, J. M. (2020). Causal Inference: What If. Chapman & Hall/CRC.


Beebee, H. (Ed.). (2010). The Philosophy of Causation. Oxford University Press. (Chapter on graphical models).


Spirtes, P. (2010). Introduction to causal inference. Journal of Machine Learning Research, 11, 1643–1662.


Zhang, J., & Spirtes, P. (2008). Detection of unfaithfulness and robust causal inference. Minds and Machines, 18(2), 239–271.


Peters, J., Janzing, D., & Schölkopf, B. (2017). Elements of Causal Inference: Foundations and Learning Algorithms. MIT Press.


Hitchcock, C. (2018). Causal models. In E. N. Zalta (Ed.), Stanford Encyclopedia of Philosophy.


Pearl, J. (2010). The foundations of causal inference. In Handbook of Causal Analysis for Social Research. Springer.


评论