预计阅读时间：2分钟48秒

词语如何对应现实：指称理论与向量空间对比

大模型的词向量根本不认识现实里的“水”，它仅靠统计文本共现频率将语义压缩为数学坐标。缺乏因果链条与物理接触，AI永远跨不过符号到实体的鸿沟，它复述的只是人类书写习惯，从未真正抬头看过天。

可能包含AI生成内容

词语与实物的挂钩始于直觉

你平时怎么确定一个词，真的对上了现实里的某个东西。

先别管哲学家的定义。退一步看。街角立着块牌子，写着“中山路”。你走过去，不需要查市政档案，也不用背诵道路沿革。你认得它，是因为它就在那儿。词语和实物的挂钩，看起来是个直觉动作。分析哲学却在这上面磨了快一百年。

意义不在头脑而在传递链条上

罗素最早把这套直觉拆成逻辑算式。
他写《论指称》的时候，想解决一个麻烦：那些现实中不存在的东西，语言怎么处理。比如“当今法国国王”。罗素认为，词的意义不在它背后藏着的实体，而在它携带的描述条件。说“金山”，其实是在说“存在一个东西，它是金的，它是山”。你不需要真的见过一座金山。只要条件拼得上，指称就成立。这招很省事。把指称问题变成逻辑运算，处理起来干净利落。但描述条件一旦拼不上，麻烦就来了。

克里普克在大半个世纪后直接改了写法。《命名与必然性》里写得很清楚。指称不是靠你脑子里那堆描述清单维持的。你提到“爱因斯坦”，可能记错他的生平，可能搞混他的照片，甚至可能把相对论的功劳算错人。这都不妨碍你指的就是那个发明了光电效应的物理学家。指称靠的是因果链条。最初有人给新生儿命名，或者第一次把某种物质叫“水”。这个名字顺着社会交往传下来。你拿到这个词的时候，接上的是一条历史线索。现实里的物体，先被命名，再被使用。意义不在头脑里，在链条上。但这套链条一旦断了，指称怎么维持。

这很矛盾。

算法用概率稳定性替换指称定位

因果链条理论能应付大多数日常指认。可语言的实际运行，从来不是一条笔直的线。二十世纪中叶的语言学提出过另一种方案。弗斯那句“观其伴知其义”被后来的数据科学捡了回去。大模型的词向量生成，完全放弃了因果链条和描述清单。它只看一个词在海量文本里和谁挨在一起。共现频率决定位置，数学距离代替了哲学定义。你说“苹果”，向量空间不关心是科技公司还是果园里的。它只看这个词前后常出现哪些词。训练数据喂进去，权重调出来，语义变成坐标里的一个点。没有命名仪式，没有历史传递。统计关联建立起来之后，下一步就看它能不能验证其实际应用效果。

向量空间的生成逻辑，和因果链条完全背道而驰。你不需要知道一个词最初是谁喊出来的，也不需要追踪它在历史文献里的流转轨迹。算法只管统计。它在几十亿段文本里扫描共现频率，把上下文关系压缩成数值矩阵。两个词靠得近，不是因为它们指向同一个物理实体，而是因为它们在人类书写习惯里经常结伴出现。这种建构方式绕开了哲学上的“指称定位”难题。它不追问“水”的必然属性是H₂O还是透明液体，它只记录“水”经常和“喝”“河流”“解渴”一起出现。指称的稳固性，被替换成了概率的稳定性。语言不再是对现实的静态映射，而是文本生态里的动态平衡。这种平衡能维持多久，取决于语料库的覆盖范围。

概率稳定性听起来很实用。可一旦你要用它去指认具体的物理对象，差异就显现出来。

符号排列无法跨越文本到实物的坎

物理对象的指认，需要刚性。普特南提过“孪生地球”的思想实验。两个星球上的人都说“水”，描述条件完全一样。但一个星球的液体是H₂O，另一个是XYZ。因果指称理论会提示你，这是两种不同的东西。因为最初的命名事件绑定了不同的物质实体。向量模型在这里会失效。它只能看到“水”在文本里的用法高度重合。它没有感官，没有空间坐标，也没有和物质世界发生因果接触的机会。它处理的是符号的排列组合，无法直接对应物理实体。符号接地问题在这里暴露得很清楚。向量可以逼近人类描述事物的习惯，但它跨不过从文本到实物的那道坎。你问它窗外的天气，它只能复述气象数据的文本模式。它没有抬头看过天。

但现实不配合逻辑。

指示词的边界问题，把这种差异放得更大。你指着面前的一滩积水说“这水很冷”。因果理论会说，这个“这”直接锁定了你视网膜上的那个空间位置。它是索引性的，脱离你的身体和视角就失去意义。向量模型没有身体，也没有视角。它只能把“这水很冷”当成一个训练样本，记录“这”“水”“冷”在语料里的共现概率。当它生成“这水很冷”时，它指向的不是任何真实的水洼，而是文本里最符合概率的接续方式。大语言模型在处理第一人称和第二人称时，同样依赖这种概率接续。它模仿人类说话的节奏，但无法建立“我在此时此地”的真实指涉。指称脱离了具身位置，就只剩下一串符号的自我循环。

逻辑起点与文本分布拼合仍有缺口

因果链条理论也不是万能钥匙。现实里的很多指称，本身就带着模糊地带。你说“这座山”，山脚到山脊的过渡带在哪里，地质学划的是等高线，日常语言划的是习惯。因果指称理论依赖清晰的命名事件。可大多数词汇的诞生，根本没有某个人在某一天郑重其事地宣布“从此它叫这个”。它是慢慢用出来的。词义漂移，语境切换，这些过程在逻辑链条里很难找到明确的节点。向量空间反而擅长处理这种连续性。它把“山”放在一个连续变化的数值范围里。你调整上下文参数，语义重心就会跟着移动。面对那些没有明确命名仪式的日常事物，统计学方法更具优势。

两套路摆在这儿，各自有局限。一个死磕历史的起点，一个依赖文本的分布。你描述一个具体物件时，用的往往不是纯逻辑，也不是纯概率。你靠的是习惯，靠的是语境，靠的是当下手指指向的那块地方。哲学模型负责解释命名的起点，向量空间负责模拟使用的过程。两者拼在一起，依然留着一个缺口。你指着桌上的杯子说“这个”，系统能算出它属于餐具类，能补全它可能装着咖啡。但它不知道玻璃的反光角度，也不知道杯底那道划痕是怎么来的。指称的最后一环，始终留在物理接触的那一瞬间……