持节
预计阅读时间:2分钟21秒

奥卡姆剃刀到底在反对什么

奥卡姆剃刀从不承诺简单即真理,它只负责切除无法带来新预测力的多余假设。拉普拉斯敢对拿破仑说“我不需要上帝假设”,正是因为剃刀砍掉的从来不是理论复杂度,而是毫无推演价值的无效冗余。

可能包含AI生成内容

0
0

剃刀切断的是无效的概念堆砌


奥卡姆剃刀从来不承诺简单就是正确。初学者常将奥卡姆剃刀误读为审美偏好,以为公式越短越接近真理。这是一种误读。它只负责切断无法带来新解释力的多余假设。


十四世纪初,威廉在牛津大学讲授逻辑学时,面对的并非物理实验,而是神学辩论中的概念堆积。当时的经院哲学围绕共相展开争论。实在论者坚持认为,具体的红苹果和红布匹之外,存在一个独立运行的红性。威廉把这种设定直接剔除。他主张实在世界只包含个别事物,通用词汇只是人脑赋予的标签。他在《箴言书注》里写下拉丁文原句。用更少的前提能推导出的结论,不应叠加更多前提。这句话的指向很明确。当时的神学家试图用层层叠叠的抽象实体来缝合信仰与理性,结果论证链条越来越长。威廉的立场是,这些实体不增加任何实际推演能力,只让讨论陷入文字游戏。理论必须保留能对接经验事实的部分。


多余的词汇无法推演出新现象。


科学模型以预测精度为存续标准


十七世纪的自然哲学家把这种倾向搬进科学研究。牛顿在《自然哲学的数学原理》第三卷开卷处列出推理规则。第一条规则写明,寻求自然事物的原因时,不应超出解释现象所必需的范围。这条规则成为后来科学方法的核心支柱。十九世纪二十年代,天文学家观测到天王星轨道与牛顿力学预测存在偏差。学者没有立刻修改引力公式。勒威耶通过数学计算反推,认为偏差源于一颗未知行星的摄动。柏林天文台根据他提供的坐标,在一夜之间找到了海王星。计算过程没有引入任何额外的力学假设。牛顿体系的预测力已经足够。拉普拉斯后来向拿破仑演示他的天体力学模型。皇帝问他为什么全书不提上帝。拉普拉斯回答,他的推导不需要这个假设。引力方程已经能完整复现行星运行轨迹。


人们常把剃刀误解为真理的筛选器。严格说来,它只处理假设的冗余度。它不保证留下的模型一定正确。量子力学建立初期的波函数与概率幅概念,完全违背经典直觉。物理学家没有因为理论复杂就抛弃它们。这些概念能算出氢原子光谱的精确波长,能解释光电效应的实验数据。剃刀的运作逻辑很直接。模型A能解释观测集。模型A加模型B也能解释同一批观测集。且模型B没有提供额外的预测精度或计算便利。此时,B必须被移除。移除的原因不是B结构繁琐,而是B不产生新的推演结果。科学史上被淘汰的燃素说、地心说本轮体系,都是因为它们在数学推演和实验对照中失去了偿付能力。托勒密体系的追随者为了维持地球静止的预设,不断叠加小圆套大圆的几何构造。开普勒用椭圆轨道替换了这些构造。行星运动的数学描述突然变得紧凑。预测精度随之上升。


理论网络修补遵循最小改动路径


十九世纪末,法国科学史家皮埃尔·迪昂指出,实验永远无法孤立地检验单个假设。物理理论是一个整体网络。观测数据出现异常时,科学家可以选择修改核心定律,也可以选择调整辅助条件。剃刀在这里提供了一种决策权重。当两种修补方案都能拟合数据,且都未被直接证伪,研究者会优先选择改动更少、牵连更窄的那一个。这并非出于对简洁的偏爱,而是出于对理论稳定性的维护。修改的链条越长,引入未知误差的概率就越大。二十世纪的威拉德·奎因进一步推演了这种观点。他指出,经验内容并不固定地绑定在特定语句上。我们面对经验反常时,可以在理论网络的任何位置进行切割。剃刀此时充当了权重分配工具。它不规定唯一的航线,只提示哪条路线的改动成本最低。


形式化压缩不等于客观结构的还原


现代统计学将这种逻辑转化为具体的惩罚函数。赤池信息量准则与贝叶斯信息准则都在数学层面约束模型参数数量。参数越多,曲线越能贴合训练数据。过度贴合意味着模型记住了数据里的随机噪声。统计学家发现,参数数量与实际预测误差之间存在明确的数学关系。剃刀在数据建模中变成了一种正则化手段。但它的适用范围有严格限制。生物体内的代谢通路布满冗余分支。基因组调控网络存在大量备份机制。这些结构不是理论构建的失误,而是生命系统在演化中保留的容错设计。用简化原则直接裁剪生物组织,往往会破坏维持功能的关键回路。它只适用于人类构建解释工具的过程,不适用于直接修改客观实在。


理论表述的压缩不等于客观结构的还原。


理论成分必须交出可验证的解释力


奥卡姆剃刀的真正指向,是解释者填补认知空白的惯性。引入无法检验、无法推导的实体,是最省力的做法。它要求每一个被纳入理论的成分都必须交出解释力。无法对接新数据,就离开。无法缩小预测误差,就退出。当代理论物理学者用它审视弦理论的高维紧致化方案。机器学习工程师用它压缩神经网络的权重参数。它始终对准那些只增加计算负担、不提升预测精度的设定。当一套模型能完美复现历史数据,却在面对未知输入时频繁失效,我们该保留它的内部自洽,还是承认它的推演已触及上限……

评论
Copyright Created by DataER | 沪ICP备2024052789号-5 | 沪公网安备31010402336337号