预计阅读时间：2分钟21秒

大脑如何用预测代替真实感知

你看到的根本不是真实世界，而是大脑提前算好的内部推演。视网膜每秒传输的千万比特原始数据中，99.99%都被预测模型直接过滤，神经系统只处理“意外”，感官纯粹用来挑错。

可能包含AI生成内容

皮层预测覆盖原始感官信号

大脑从来不靠被动接收外界信号来认识世界，它是个不断生成内部模型并实时修正的预测机。我们此刻看到的每一帧画面，都是皮层提前算好的推演，感官输入只负责挑错。讲真，感知不是输入决定输出，而是预测决定我们注意到什么。

传统教材习惯把视觉通路画成单向流水线。光线穿过晶状体，视网膜转化为电信号，经外侧膝状体中继，一路堆叠到枕叶皮层。这套自下而上的假设在二十世纪初的解剖学框架里站得住脚，现在的电生理数据已经把它推翻了。大脑皮层的连接根本不是单行道。自上而下投射的神经纤维数量，是自下而上输入通道的数倍。高级皮层时刻在向低级区域发送预期信号。低级区域拿到预期后只做一道减法，把实际收到的光电信号减去预期值，剩下的预测误差才继续往上传。这套计算在几十毫秒内循环往复。大脑不处理冗余数据，它只处理意外。

先验经验主导视觉统计推断

空心面具错觉就是这套算法的副产品。

把人脸面具翻到背面，几何形状明明是凹陷的。人眼盯着它缓慢转动，大脑却固执地判定它是凸起的。视网膜传回的明暗梯度清清楚楚写着“内凹”，高级视觉皮层直接驳回了这份报告。人类在进化过程中积累的三维人脸数据 overwhelmingly 指向凸起形态。当感官信号存在模糊区间，或者预测模型置信度极高时，神经系统会自动调高先验权重，压制底层输入。视觉系统没有出错，它在执行最稳妥的统计推断。

把这套推断写成数学语言，就是贝叶斯公式在神经回路里的物理落地。皮层不关心绝对亮度或绝对形状，它只计算概率分布。先验分布代表过去的经验积累，似然函数代表当前感官输入的可靠性。大脑把两者相乘，得到后验分布，也就是我们实际感知到的世界。关键在于权重分配。当环境嘈杂或光线昏暗时，似然函数的方差变大，系统会本能地依赖先验。当先验经验本身足够稳定，哪怕感官输入给出相反的证据，皮层也会把误差标记为噪声并直接丢弃。预测编码的核心操作就是动态调节这两个信号的相对精度。

能量约束驱动信息过滤机制

维持这种预测架构的根本动机是能量约束。大脑占体重的百分之二，却消耗全身两成的基础代谢。如果每一毫秒的原始视觉数据都要从零解码，皮层的葡萄糖供应根本撑不住。把环境建模为可预测的序列，能把信息处理成本压到数量级上的最低点。学习过程本质上就是不断校准内部权重。遇到预测误差持续偏大的事件，突触连接强度会跟着调整，降低下一次同类事件的误差值。卡尔·弗里斯顿等人建立的数学模型把这套逻辑量化为自由能最小化。生物体必须把内部状态的不确定性控制在可承受范围内，预测编码就是神经回路执行这一指令的物理实现。误差信号驱动突触可塑性，可塑性重塑下一个周期的预期，循环一旦跑通，系统就能用极少的能耗维持高精度的环境追踪。

数据过滤的尺度极其悬殊。

微电极记录能直接抓到皮层里的两类响应特征。一类神经元对特定朝向或空间频率的刺激反应稳定，负责发放预测信号。另一类神经元只在预期落空时突然高频放电，专门编码误差。抑制性中间神经元在初级皮层提前拦截符合预期的背景活动，把偏离轨道的异常数据放进来。脑电图实验里的失匹配负波（MMN）是这套机制的直接读数。当听觉皮层已经适应了一连串固定频率的滴答声，突然插入一个不同频率的音符，脑电波会在刺激出现后一百五十到两百毫秒之间出现显著的负向偏转。这个偏转不是对声音本身的反应，而是对“预期被打破”的反应。视网膜每秒向大脑输送大约一千万比特的原始电信号，真正能穿透层级过滤、进入高级联合皮层的信息量只有几十比特。中间消失的九百九十多万个比特，全被自上而下的模型提前消化。

预测失衡引发感知系统脱轨

预测权重一旦失衡，感知就会脱轨。

精神分裂症的部分阳性症状，可以用先验置信度过高来解释。内部模型过于强势，把无关的感官波动强行绑定为有意义的因果线索。幻听不是外部声波闯入，是预测回路自己跑得太快，误差校正跟不上节奏。多巴胺系统的异常发放进一步放大了误差信号的权重，让患者把随机事件当成高度相关的特殊指示。反过来看，孤独症谱系障碍的某些感知特征，则指向误差信号权重过高。系统对微小的环境变化极度敏感，先验经验无法有效平滑输入，导致外界信息以未经压缩的原始形态涌入，引发强烈的认知过载。两套病理状态从相反方向印证了同一套计算规则：感知质量取决于预测与误差之间的动态平衡。

视觉构建持续压缩误差残差

我们总以为眼睛在诚实记录物理世界，其实视网膜只是向皮层传递差异信号。每一次眨眼都在刷新预期分布，每一次注视都在压缩误差残差。清醒状态下的视觉构建和快速眼动睡眠时的梦境生成，调用的是同一组皮层回路。区别仅在于误差信号能否顺利穿透抑制层，把模型拉回当前的物理约束。