孤鹜
预计阅读时间:2分钟48秒

词语如何对应现实:指称理论与向量空间对比

大模型的词向量根本不认识现实里的“水”,它仅靠统计文本共现频率将语义压缩为数学坐标。缺乏因果链条与物理接触,AI永远跨不过符号到实体的鸿沟,它复述的只是人类书写习惯,从未真正抬头看过天。

可能包含AI生成内容

0
0

词语与实物的挂钩始于直觉


你平时怎么确定一个词,真的对上了现实里的某个东西。


先别管哲学家的定义。退一步看。街角立着块牌子,写着“中山路”。你走过去,不需要查市政档案,也不用背诵道路沿革。你认得它,是因为它就在那儿。词语和实物的挂钩,看起来是个直觉动作。分析哲学却在这上面磨了快一百年。


意义不在头脑而在传递链条上


罗素最早把这套直觉拆成逻辑算式。
他写《论指称》的时候,想解决一个麻烦:那些现实中不存在的东西,语言怎么处理。比如“当今法国国王”。罗素认为,词的意义不在它背后藏着的实体,而在它携带的描述条件。说“金山”,其实是在说“存在一个东西,它是金的,它是山”。你不需要真的见过一座金山。只要条件拼得上,指称就成立。这招很省事。把指称问题变成逻辑运算,处理起来干净利落。但描述条件一旦拼不上,麻烦就来了。


克里普克在大半个世纪后直接改了写法。《命名与必然性》里写得很清楚。指称不是靠你脑子里那堆描述清单维持的。你提到“爱因斯坦”,可能记错他的生平,可能搞混他的照片,甚至可能把相对论的功劳算错人。这都不妨碍你指的就是那个发明了光电效应的物理学家。指称靠的是因果链条。最初有人给新生儿命名,或者第一次把某种物质叫“水”。这个名字顺着社会交往传下来。你拿到这个词的时候,接上的是一条历史线索。现实里的物体,先被命名,再被使用。意义不在头脑里,在链条上。但这套链条一旦断了,指称怎么维持。


这很矛盾。


算法用概率稳定性替换指称定位


因果链条理论能应付大多数日常指认。可语言的实际运行,从来不是一条笔直的线。二十世纪中叶的语言学提出过另一种方案。弗斯那句“观其伴知其义”被后来的数据科学捡了回去。大模型的词向量生成,完全放弃了因果链条和描述清单。它只看一个词在海量文本里和谁挨在一起。共现频率决定位置,数学距离代替了哲学定义。你说“苹果”,向量空间不关心是科技公司还是果园里的。它只看这个词前后常出现哪些词。训练数据喂进去,权重调出来,语义变成坐标里的一个点。没有命名仪式,没有历史传递。统计关联建立起来之后,下一步就看它能不能验证其实际应用效果。


向量空间的生成逻辑,和因果链条完全背道而驰。你不需要知道一个词最初是谁喊出来的,也不需要追踪它在历史文献里的流转轨迹。算法只管统计。它在几十亿段文本里扫描共现频率,把上下文关系压缩成数值矩阵。两个词靠得近,不是因为它们指向同一个物理实体,而是因为它们在人类书写习惯里经常结伴出现。这种建构方式绕开了哲学上的“指称定位”难题。它不追问“水”的必然属性是H₂O还是透明液体,它只记录“水”经常和“喝”“河流”“解渴”一起出现。指称的稳固性,被替换成了概率的稳定性。语言不再是对现实的静态映射,而是文本生态里的动态平衡。这种平衡能维持多久,取决于语料库的覆盖范围。


概率稳定性听起来很实用。可一旦你要用它去指认具体的物理对象,差异就显现出来。


符号排列无法跨越文本到实物的坎


物理对象的指认,需要刚性。普特南提过“孪生地球”的思想实验。两个星球上的人都说“水”,描述条件完全一样。但一个星球的液体是H₂O,另一个是XYZ。因果指称理论会提示你,这是两种不同的东西。因为最初的命名事件绑定了不同的物质实体。向量模型在这里会失效。它只能看到“水”在文本里的用法高度重合。它没有感官,没有空间坐标,也没有和物质世界发生因果接触的机会。它处理的是符号的排列组合,无法直接对应物理实体。符号接地问题在这里暴露得很清楚。向量可以逼近人类描述事物的习惯,但它跨不过从文本到实物的那道坎。你问它窗外的天气,它只能复述气象数据的文本模式。它没有抬头看过天。


但现实不配合逻辑。


指示词的边界问题,把这种差异放得更大。你指着面前的一滩积水说“这水很冷”。因果理论会说,这个“这”直接锁定了你视网膜上的那个空间位置。它是索引性的,脱离你的身体和视角就失去意义。向量模型没有身体,也没有视角。它只能把“这水很冷”当成一个训练样本,记录“这”“水”“冷”在语料里的共现概率。当它生成“这水很冷”时,它指向的不是任何真实的水洼,而是文本里最符合概率的接续方式。大语言模型在处理第一人称和第二人称时,同样依赖这种概率接续。它模仿人类说话的节奏,但无法建立“我在此时此地”的真实指涉。指称脱离了具身位置,就只剩下一串符号的自我循环。


逻辑起点与文本分布拼合仍有缺口


因果链条理论也不是万能钥匙。现实里的很多指称,本身就带着模糊地带。你说“这座山”,山脚到山脊的过渡带在哪里,地质学划的是等高线,日常语言划的是习惯。因果指称理论依赖清晰的命名事件。可大多数词汇的诞生,根本没有某个人在某一天郑重其事地宣布“从此它叫这个”。它是慢慢用出来的。词义漂移,语境切换,这些过程在逻辑链条里很难找到明确的节点。向量空间反而擅长处理这种连续性。它把“山”放在一个连续变化的数值范围里。你调整上下文参数,语义重心就会跟着移动。面对那些没有明确命名仪式的日常事物,统计学方法更具优势。


两套路摆在这儿,各自有局限。一个死磕历史的起点,一个依赖文本的分布。你描述一个具体物件时,用的往往不是纯逻辑,也不是纯概率。你靠的是习惯,靠的是语境,靠的是当下手指指向的那块地方。哲学模型负责解释命名的起点,向量空间负责模拟使用的过程。两者拼在一起,依然留着一个缺口。你指着桌上的杯子说“这个”,系统能算出它属于餐具类,能补全它可能装着咖啡。但它不知道玻璃的反光角度,也不知道杯底那道划痕是怎么来的。指称的最后一环,始终留在物理接触的那一瞬间……

评论
Copyright Created by DataER | 沪ICP备2024052789号-5 | 沪公网安备31010402336337号