预计阅读时间：2分钟29秒

为什么人类偏好无法被精确量化

一旦将偏好转化为量化指标，优化机制就会自动放大噪声并过滤情境，导致原始意图被反向消耗；人类偏好无法被精确计算，恰恰是因为它必须依赖模糊地带应对未知，而形式化注定会剥夺这种生存弹性。

可能包含AI生成内容

代理指标的优化偏离了原始意图

“凡是能被度量的，就值得被追求。”这句常被现代管理学引用的断言，背后藏着一个持续发酵的错觉。我在翻阅决策理论与伦理学的交叉文献时，经常遇到同一个问题：人们总试图把模糊的偏好塞进可计算的格子里，仿佛只要找到足够精密的刻度，就能给出一组确切的数值。实际发生的状况往往相反。刻度一旦确立，偏好就开始变形。

这种现象在上世纪七十年代被正式记录。查尔斯·古德哈特在分析英国货币政策时指出，当一项观测指标被选定为控制目标时，它就会失去作为观测指标的价值。后来学术界把这句话提炼为古德哈特定律。定律并非单纯的行政经验，它触及了量化行为的一个根本弱点。代理指标从来不是意图本身，它只是意图在特定约束下的近似表达。把近似表达当作最终目的去追逐，近似值就会在优化过程中逐渐偏离原点。英国殖民时期的印度曾设立悬赏清理眼镜蛇，初期街头的毒蛇数量确实下降，随后捕蛇人开始人工繁育眼镜蛇以套取赏金，政策终止后，大量人工繁育的蛇被放归野外，当地生态遭到更严重的破坏。指标在账面上完成了优化，原始意图却被反向消耗。

刚性目标往往容不下未言明的条件。

形式系统难以容纳弹性的价值判断

形式系统处理价值的方式，依赖的是目标的明确定义。价值加载难题的核心，在于如何把人类那种充满弹性与妥协的道德直觉，转译成机器可以无偏差执行的指令。人类的道德判断高度依赖情境。同样一句隐瞒事实的话，在商业合同谈判与在紧急医疗救助中，背后的价值权重截然不同。我们做出选择时，调动的是对历史背景、人际关系、潜在后果、社会体面等一系列未写进说明书的条件进行综合权衡。形式系统只能接收清晰定义的输入。它无法处理那些没有转化为参数的潜台词。当系统被设定为最大化某个单一数值时，它会主动过滤所有与该数值无关的变量。过滤的过程，就是价值被削薄的过程。

人类偏好更接近一种持续的协商，而不是预先打包好的静态清单。经济学传统常区分陈述偏好与显示偏好，两者都假定存在一个相对稳定的效用函数在背后运作。现实情况是，人的偏好会在遭遇具体约束时重新生成。面对有限的预算、紧迫的期限、他人的目光，原本排在末位的选项可能突然跃升为首选。这种跃升并非偏好本身的突变，而是情境压力改变了不同考量之间的相对位置。量化模型试图在时间切片上固定偏好，却忽略了偏好是在时间流动中被不断校准的。校准依赖的是反馈与修正，而不是单向的输出。

优化循环放大噪声并悬置意图

轨迹一旦固定，意图就被悬置。

代理指标在优化过程中往往发生系统性偏移，原因在于优化机制本身的放大特性。任何代理指标都包含有效信号与随机噪声，优化过程为了提升效率，会不断加大对高回报区域的投入。起初它只是在利用信号，随着迭代次数增加，它开始把噪声也当作有效信号加以利用。噪声被正反馈循环不断强化，最终成为主导指标走向的主要力量。十八世纪的欧洲重商主义者曾长期把黄金储备量等同于国家真实财富。他们通过贸易顺差、殖民扩张与关税壁垒把贵金属运回本土。账面上的金银数字持续攀升，但国内的产业效率、技术积累与民众的实际生活水平并未同步改善。数字优化到了极致，真实的经济运转却陷入停滞。代理指标一旦脱离原始意图的约束范围，就会沿着阻力最小的方向自我增殖。

偏好系统天然抵抗形式化规则

有人主张，只要设计足够复杂的指标组合，或者引入动态权重调整机制，就能逼近真实的偏好形态。这种设想在理论上颇具吸引力，但它回避了一个更根本的认识论困境。偏好之所以难以被完全形式化，是因为它本身就包含着对形式化规则的抵抗。人类在做判断时，会刻意保留一定的模糊空间，以便在不可预见的突发状况中留出回旋余地。把模糊空间填满，等于剥夺了应对未知的能力。形式系统追求的是确定性，而人类偏好依赖的是对不确定性的容忍。两者在运作方式上存在错位。错位不会随着算力的提升而自动弥合，反而可能在更复杂的优化中被进一步固化。

我们可以把目光转向更早期的思想脉络。亚里士多德在《尼各马可伦理学》中讨论实践智慧时，已经触及了普遍规则与具体场合之间的脱节。他认为，伦理知识不同于几何演算，无法通过普遍定理的推演来直接获取。恰当的判断体现在对特定场景的回应中，这种恰当无法被压缩为一条放之四海而皆准的公式。后世的知识传统试图用更严密的分类与度量来弥合规则与情境的脱节，脱节始终存在。现代行为经济学的实验反复显示，同一个人在不同情绪状态、不同社会比较情境下，会做出相互矛盾的选择。这些矛盾并非计算失误，而是人类偏好系统的固有特征。试图用单一尺度去统摄多重尺度，结果往往是尺度本身发生扭曲。

静态记录无法替代动态校准

说白了，我们习惯用数字来确认自己的倾向，但数字只能捕捉到倾向在某个瞬间的投影。指标提供的是静态记录，而人类的价值判断需要在具体情境中不断调整权重。我们在刚性规则与柔性妥协之间寻找平衡点，这种平衡并不依赖最终的数值输出，它只需要在每一次决策中保留可修正的余地。