橘智橘智
偶是大橘子哇
预计阅读时间:7分钟45秒

语言理解中的幻觉

维特根斯坦、神经科学,以及为什么语言在人类或 AI 那里都不是思想

0
0

本文原作者:Stephanie Shen


去年,当我读石黑一雄的小说《长日将尽》时,我深深震撼于这样一个事实:我从纸面上的字里行间读出了远多于字面本身的东西。小说以主人公史蒂文斯的视角展开,描绘了一个极度克制的人:他把自己的一生完全献给了职业,却以牺牲个人关系,甚至牺牲自身完整性为代价。然而,作为读者,我却能够充分感受到那些他没有说出口的话,以及那些被他长期否认和压抑的情感。

而且,哪怕读完之后直到今天,我依旧无法停止思考这部小说。我相信,每个人在阅读一本与自己产生共鸣的书时,都会有类似的体验。我们对语言的理解,总是超出我们所读到或听到的字面意义。语言会召唤起我们自身的情感、感受、记忆与想象。


从作家的角度看,把一个故事化为恰当的文字,本身就是一个漫长而艰难的过程。石黑一雄曾给自己设定了一个为期四周的突击写作期,每周一到周六,从早上九点写到晚上十点半。凭借这种高度投入与专注,他的确勾勒出了小说的基本构想,但写出来的却是“糟糕透顶的句子、难看至极的对白,以及毫无进展的场景”。在正式出版之前,他又花了许多个月去打磨,而出版则是两年后的事。


石黑一雄的挣扎,反映了思想或感受与我们最终能用语言表达出来的内容之间固有的裂隙。这是我们每个人在试图表达经验时都会遭遇的共同难题。另一位作家迈克尔·波伦在《卫报》的一篇文章中,对此有极为精准的描述: “我一直以为,我的意识流主要由一种内在独白构成,偶尔也许是对话,但无论如何总是由词语组成的;毕竟,我是个作家。但事实却是,我那些所谓的思想——如果把这些轻飘飘的心理活动痕迹称为‘思想’还算抬举的话——其中很大一部分其实是前语言的,它们往往以图像、感觉或概念的形式出现,而词语则拖在后面,仿佛一种事后的补充,是为了把那些难以捉摸的意义微光,迟来的翻译成某种更具体、更可分享的东西所做的尝试。”


相比之下,今天的大语言模型(LLMs),如 ChatGPT、Claude 和 Grok,几乎可以即时生成文本。它们依赖人类去收集、整理并预处理海量文本,将其转化为所需的数值数组;然后基于对每个 token 的统计预测,以完美的语法输出流畅文字,而并没有在“思考”或“理解”。


然而,人类往往会被它们雄辩、看似自信的回答所迷惑,仿佛这些输出真的出自一个人。更进一步,许多人甚至担忧甚至恐惧:LLM 可能在不久的将来获得意识。


要真正看清这种“理解的幻觉”,我们需要更好地把握语言本身的性质,以及人脑如何处理语言。在本文中,我们将探讨维特根斯坦的语言哲学与当代神经科学的洞见。借助这些,我们将更清楚地理解 LLM 与人类心灵之间的差异;更重要的是,我们也能以更清醒的期待、更扎实的判断来面对这些系统,明白它们能做什么、不能做什么。


维特根斯坦的语言游戏理论

二十世纪初,路德维希·维特根斯坦原本是一名机械工程专业的学生,后来在剑桥师从著名数学家与哲学家伯特兰·罗素,从而转向哲学。罗素立刻看出维特根斯坦是个天才,称他“热情、深刻、强烈而富于支配力”。


罗素没有看错。维特根斯坦因其独特而深刻的思想而被承认,这种思想在他之前和之后的哲学传统中都显得格格不入。他的第一部哲学著作,是在三十二岁时发表的一本 75 页小书,题为《逻辑哲学论》。之后,他曾做过小学教师,在奥地利偏远村庄任教约六年。后来,他重返剑桥,成为哲学教授。他的第二部杰作《哲学研究》在他 1951 年去世后才出版,这部作品以惊人的敏锐洞见揭示了语言究竟是什么,以及它是如何运作的。


他的核心观点是:语言的意义,是通过人类在日常生活中的使用,通过共享的语境与实践而传达出来的。


他认为,语言在本性上是模糊的,其边界是朦胧不清的。它无法为一个概念提供完备的定义。比如,什么是“椅子”?牛津词典把它定义为:“供一个人坐的独立座位,通常有靠背和四条腿。”但懒人沙发算不算椅子?一个人坐着的石头又算不算?它们都可以供一个人坐,却没有腿。那沙发床算不算椅子?它有靠背和四条腿,却最多可以坐三个人。


“椅子”的真正意义,只有在其被实际使用、并且给出充分语境和明确情境时,才可能变得精确。一个定义只有在给定特定目的时,才可能变得清晰。同样的道理也适用于“游戏”这一概念。正如维特根斯坦所写:


69. 我们会怎样向某人解释什么是游戏?我想,我们会向他描述各种游戏,并且可能会在描述之后加上一句:“这些以及类似的东西都叫作‘游戏’。”而我们自己难道知道得更多吗?难道只是我们不能精确地告诉别人什么是游戏吗?——但这并不是无知。我们不知道边界在哪里,因为根本就没有画出边界。再说一遍:我们当然可以为了某个特殊目的画出一条边界。可只有这样,这个概念才变得可用吗?完全不是!除非也许正是为了那个特殊目的。


他进一步指出,我们之所以能思考或理解词语,是因为会把它们与相似的例子联系起来。这种联系被维特根斯坦称为“家族相似性”,而这些“家族”彼此之间往往又相互重叠:


66–67. ……我们看见的是一个复杂的相似性网络,纵横交错:有大的相似,也有小的相似。我想不出比“家族相似”更好的表达来刻画这些相似性;因为一个家族成员之间的各种相似——体格、面部特征、眼睛颜色、步态、气质等等——正是以这种重叠与交错的方式彼此关联的。——因此我说:“游戏”构成了一个家族。


这也解释了为什么像德性、正义、善、美这样的概念,自柏拉图以来已经争论了两千多年,却始终没有得到最终解决。维特根斯坦认为,这是因为原初的“什么是……”这一提问方式本身就错了:它把概念从具体语境中剥离出来,而哲学家们一直在寻找一种绝对定义,然而这种定义实际上并不存在。


基于这一点,维特根斯坦把语言称作“游戏”,其意义取决于参与者——也就是生产或接受文本的人——如何玩这个游戏。不同职业、不同教育背景的人,会在不同的社会与文化语境中,以不同方式玩这些游戏。这就是为什么人们如此常常陷入无休止且毫无结果的争论:每个人都在对着别人说话,却彼此说不通——因为他们玩的其实是不同的游戏,尽管说的是同一种语言。

更重要的是,维特根斯坦指出,我们是通过日常的“生活形式”来参与语言游戏的,而这种参与又由手势、面部表情、情绪、感觉与行动所中介。换言之,语言游戏总是涉及超出词句之外的、具身的人类活动。


维特根斯坦进一步深入到人类心灵之中,并发现,在许多情况下,语言缺乏足够的词语来描述或区分心理状态。一个例子就是“咖啡的香气”:


610. 描述一下咖啡的香气!——为什么做不到?是因为我们缺少词语吗?而这些词语究竟缺在什么地方?——可是,我们又是从哪里得出这样的想法:似乎这种描述终究一定是可能的?你曾经真切感到过自己缺少这样一种描述吗?你曾试图去描述这种香气,却失败了吗?


你或许会惊讶地发现,对于许多气味,我们都缺少恰当的词语。我们能做的,要么是直接用对象的名称去定义它,要么是借用其他感官领域的词,比如“鲜活的”“干燥的”“辛辣的”等等。然而,喝咖啡的人却能够理解“咖啡的香气”这一说法,因为他们会依据自己此前的经验来把握它。同一个词,在不同个体那里,会唤起不同层次的理解,以及与之相连的心理状态。

维特根斯坦还确认,我们大多数时候并不是以语言来思考。他指出,在我们说出诸如“我希望……/我期待……/我相信……”之前,那首先是在思想中的一种感受,它远没有最终形成的句子那样具体。正如他所言:


2.102. 我是这样理解的:相信是一种心灵状态。它持续存在;并且这种持续独立于把它表达成一个句子的过程。


远远超前于他的时代,维特根斯坦看穿了语言制造出来的幻觉。他在《哲学研究》中指出,语言并不具有一种固定而精确的内部结构。句子的准确性与秩序,会让人误以为语言本身蕴藏着某种深刻性,从而使哲学家相信,他们可以在语言内部发现某种潜在的本质和隐藏的秩序;但事实上,这样的东西并不存在。


从这个角度看,任何建立在语言自身之上的学科,例如哲学,都不能像科学那样带来关于世界的新发现;它的作用在于澄清我们的语言本来是如何运作的。正如维特根斯坦所说,“哲学工作本质上由说明构成”,并且“哲学并不导致‘哲学命题’,而是导致命题的澄清”。它的任务不是推进理论,而是消解那些可能在语言中产生的混乱。


由此看来,今天 LLM 的流畅性,恰恰放大了维特根斯坦所警告的那种幻觉。这些系统完全在语言之中运作,生成那些之所以显得“有意义”的句子,只是因为它们极为娴熟地符合了各种语言模式与规则。


大脑中的语言处理

1861 年,法国外科医生兼人类学家保罗·布罗卡注意到,他的两位中风病人都失去了说话能力,除了能结结巴巴发出单音节声音之外,几乎无法表达;但他们仍然能够理解所听到和读到的语言。多年后的尸检中,布罗卡发现,两人的大脑都在同一区域因中风而受损:额叶左侧额下回。这个区域后来被命名为“布罗卡区”。


十二年后,德国一位年仅 26 岁的神经学家兼精神病学家卡尔·韦尼克观察到另一位中风病人:此人无法理解口头或书面语言,但说话却很流利,听觉也没有问题。病人去世后,韦尼克发现其病灶位于颞叶左侧颞上回后部,靠近听觉皮层。这个区域后来被命名为“韦尼克区”,负责语言理解,并位于负责言语生成的布罗卡区的上游。


韦尼克还提出理论:这两个区域之间必定有一条通路,将它们连接起来,以实现协调沟通。后来,这条通路被证实为弓状束。通过它,在韦尼克区中被加工过的意图意义,会被传递到布罗卡区,在那里词语按照正确顺序和句法被组织起来。最终句子的说出,则由运动皮层执行,后者再去指挥发声肌肉。


现代神经科学结合了病灶研究与正常受试者的脑成像技术,揭示出一幅远比这复杂得多的图景。首先,研究已发现更多参与语言相关处理的脑区。例如,顶叶中的角回与缘上回也对语言理解至关重要。其次,这些区域中的许多也同时参与非语言功能,例如记忆提取、空间加工以及社会互动。


此外,顶叶皮层中的初级视觉皮层负责对字母和符号进行最初的视觉处理;而与韦尼克区相邻、位于颞叶中的初级听觉皮层,则负责处理语言的声音,包括音高、音色与节奏。


简单地说,现代研究表明,语言功能高度分布于颞叶、顶叶与额叶之中,并与其他非语言功能交织在一起。“意义”并不是被储存在大脑的某一个点上;它涉及一个动态激活的、多功能网络之网,而这个网络参与语言的产生与理解。


这几乎令人惊异地支持了维特根斯坦的主张:“语言的意义在于其日常使用。” “语言的使用”,包括说、写、读,嵌入在我们的日常活动与经验之中。正如维特根斯坦所指出的,一个词或句子的意义,必须在特定语境中被解释,而这些语境中有许多恰恰是我们与现实世界互动中的非语言层面。


语言与大语言模型

维特根斯坦的语言哲学,加上我们对大脑如何处理语言的理解,使我们得以从三个方面对 LLM 作出判断:它们缺乏原创性与创造力;它们制造出意义与理解的幻觉;以及,把 LLM 用在恰当场合的最终责任,仍然在于人类。


LLM 缺乏人类的创造力

正如我们已经看到的,语言只是人类意识与经验中的一小部分。我们总是在先确定自己意欲表达的意义之后,才借助语言将其组织出来并传达出去。


按照维特根斯坦的理解,人类是作为具身的行动者参与语言游戏的,我们拥有真实的理解,并能从新的经验中带来新的观念。语言的真正创造性与原创性属于人类。


相反,LLM 只是模拟语言游戏,而并不真正生活在其中,因为它们缺乏具身的感觉、本能、情绪和意图。它们被限制在纯粹的人类生成文本空间之中。因此,它们无法创造出超越人类已有创造的新词,也无法原创性地表达复杂的感觉与情绪。它们所能做的,只是复制或模仿人类已经产生出来的东西。


例如,人类通过经历痛苦而学会“疼痛”这个词;而 LLM 则是通过阅读文本中这个词的用法来“学会”它。人类之所以理解“咖啡的香气”,是因为他们能够调动自己曾经闻到过的经验;而 LLM 无法理解那究竟是一种怎样的感受。


更进一步,科学家之所以能够做出新发现,并不只是因为阅读了研究论文。他们首先要观察物理世界、与之互动,然后设计实验与装置,收集现实数据,并进一步与现实中的关系相互验证;这些事情,LLM 都做不到。


幻觉是由我们的理解所制造出来的

人类理解的一种副产物,是我们倾向于把自己的思想与感受投射到他者身上。正如亚当·斯密在《道德情操论》中所说:

“借助想象,我们把自己置于他的位置……仿佛进入了他的身体,并在某种程度上成为了同一个人。”


这种心理投射虽然是我们对其他人类产生共情的基础,但我们也都知道,它很容易延伸到动物、物体,当然,也会延伸到一个说着完美人类语言的机器之上。


此外,正如维特根斯坦所提示的,我们对语言的理解,是扎根于“生活形式”这一共享的人类活动之中的。所以当我们说“计算机在思考”时,我们实际上是在把语言游戏延展到其原初语境之外;而伴随这种延展一起出现的,正是一种幻觉:仿佛机器也像我们一样拥有内在状态。


LLM 还会制造出一种似乎拥有“人格”的幻觉,但这种人格并不真实,它只是 AI 公司训练出来的语言风格而已。是我们自己的理解,在制造出一种印象:仿佛 LLM 正带着某种人格去传达意义。


此外,LLM 在生成输出时,并不会形成信念,也不会意图追求某种目标。它们没有判断,也没有对真理的动机。它们的结论,是基于文本中词语共现、关联与续写模式的统计追踪。


这也正是为什么它们会把“幻觉”作为一种默认模式。正如 OpenAI 在一篇论文中所说:“大语言模型有时会在不确定时进行猜测,生成貌似可信但其实错误的陈述,而不是承认自己的不确定性。”因此,它们的输出并不值得被直接信任,因为即便它们说得流畅而自信,其中也可能在事实层面完全错误。


应当以怎样的心态面对 LLM?

LLM 的优势,在于它们能够吸收并处理远超任何单一个体终其一生所能掌握的大量信息。借用维特根斯坦的观点,LLM 只不过是另一种类型的语言游戏。而关键在于:人类是否能把这个游戏玩好。

人的思考与理解是具身的,并扎根于一个远远大于语言压缩域的现实之中。LLM 所“知道”的,只是人类已经弄明白的那些东西,而那不过是现实的一个很小的子集。


真理与意义,来自人类与现实世界的互动。一旦我们牢牢站稳这一框架,LLM 就不再是什么威胁,而只是可以被利用的工具而已。从本质上说,它们与计算器或飞机并没有不同:它们能在某些特定事情上比人类做得更好,但依旧只是处在人类控制之下的工具。与其把它们拿来和人类比较,不如更专注地思考:在什么场合下,带着什么样的期待,最好地使用它们。


例如,我们可以利用 LLM 来帮助头脑风暴、汇集多元观点、识别数据中的模式,或者概括大量信息。但我们必须始终运用自己的判断与专业知识,对结果进行审查与事实核查。更重要的是,我们必须把自己的原创思考与真实经验注入其中。


总而言之,当我们阅读像《长日将尽》这样的小说时,我们其实是在为一个永远不可能被完全写尽的世界赋予意义。正如路德维希·维特根斯坦提醒我们的那样,语言的意义产生于它在人类生活中的使用。只有真正看清这一点,我们才会被促使着,用我们自己的智慧与创造力去使用 LLM,而不是把它们误认为会思考的心灵。


“语言可能成为一层屏障,横亘在思考者与现实之间。这正是为什么真正的创造性常常开始于语言结束之处。”——阿瑟·库斯勒,《创造的行为》

评论