哲学怎么看待机器的理解能力
哪怕AI能完美接梗、语气逼真,它也只是在计算下一个字的概率,对现实经验毫无概念。流畅的对话输出根本不等于真正的理解,机器永远只是在机械搬运符号,而非把握意义。
可能包含AI生成内容
流畅对话容易制造理解的错觉
对着屏幕聊了几句,常会产生对面坐着真人的错觉。语气对路。冷场了还会接梗。你信了。它懂言外之意。我也常在这上面栽跟头。我们先得退一步看。你早上去早点铺买包子,老板递过来热乎的。你扫码付钱。走人。这套动作行云流水。可老板心里是在算面碱的比例,还是纯粹肌肉记忆。你不在乎。哲学界对机器能不能“理解”的追问,起点也在这儿。阿兰·图灵在上世纪五十年代把这事摆明了。他设了个测试,把人跟机器隔在帘子两边,只准打字。只要聊天的人分辨不出对面是谁,机器就算过关。这法子很实在。它绕开了“意识”“感受”这些难以测量的词,直接把判断权交给了外部表现。
符号搬运与意义把握是两码事
行为像那么回事,不等于里面真懂。图灵测试看重的是输出结果,而不是处理过程。早期的人工智能程序伊丽莎,靠的是把用户的话拆成关键词,再套进预设的句式里回复。一位接受心理治疗的病人后来给伊丽莎的开发者写信,说这台机器比真正的医生更懂他。伊丽莎的成功证明了模仿对话的能力可以完全由规则拼凑,但它也暴露了行为测试的盲区:演得像,是否就等于理解本身。约翰·塞尔在八十年代初把这事挑明了。他抛出“中文房间”的思想实验,把一个完全不懂中文的人关在房间里,手里只给一本厚厚的规则手册。门外塞进一组符号,屋里的人按手册对照,递出另一组符号。门外的人拿到回复,会觉得里面的人中文极好。屋里的人只是在做符号搬运。他对这些符号代表的意义一无所知……希尔勒的核心观点很直接,把“处理形式”和“把握内容”拆成了两码事。计算机只能操作符号的形状,无法触及符号背后的含义。
当时的学术界没全认账。有人指出,房间里的人虽然不懂中文,但人、手册和纸笔组成的整个系统其实是懂的。系统论的观点认为,只要整体能对外部输入做出正确反应,内部组件有没有意识并不重要。后来的连接主义研究者沿着这条路走下去,把重点放在神经网络的整体涌现效应上。单个算法节点只负责传递加权数值,但上千亿个节点叠加起来,或许能自然长出理解能力。这种争论至今没有定论,但它划定了一条清晰的界线:外部行为合格,不等于内部机制相同。
概率推演缺乏现实世界的重量
现在的语言模型把语法和语义的割裂看得更清楚。训练数据里藏着海量的文本,算法的任务只是计算下一个字出现的概率。模型不需要知道“苹果”是一种水果,只需要知道在大多数句子里,“苹果”后面跟着“很好吃”或“切块”的概率更高。一位负责模型调优的工程师在后台查看日志时发现,当输入“我昨天去了一家新开的理发店”,模型会顺着概率生成关于剪发、洗头、办卡的描述。模型内部没有任何关于理发店的视觉记忆,也没有剪刀碰到头发的触觉反馈。它产出连贯文本靠的是算概率,不靠搭现实世界。认真讲,理解意味着能把新概念和旧经验连起来,能在陌生情境里做出调整。你在菜市场买菜知道,今天西红柿贵,可能因为前几天的暴雨冲坏了大棚,下次可以改买黄瓜。这种判断来自长期的身体接触和环境反馈。大语言模型没有感官,也没有在物理世界里走过路。它学到的“暴雨”和“大棚”只是语料库里的共现关系。有意思的是,有人用围棋程序做过对比,早期的软件靠穷举人类棋谱,后来的系统靠自我对弈生成新策略。即便下出人类没见过的定式,程序也只是在优化胜率函数。它不知道“赢”对棋手意味着什么,只负责让数学模型里的数值不断变大。哲学界把这种现象称为“符号落地问题”,纯数字的推演永远无法自动获得现实世界的重量。
明确能力边界才能务实使用工具
哲学讨论不是要否定这些工具的用处,而是提醒你划清边界。把符号操作当成理解,容易给技术套上不必要的期待。当模型给出错误的医学建议,或者在法律文书里编造不存在的判例时,你第一反应往往是责怪程序不认真。实际上,系统只是在执行概率推演,并不具备核对事实的能力。明确这一点,使用方式就会变得务实。程序起草的合同需要律师逐条核对条款,生成的科普文章需要作者核实数据来源。工具的价值在于处理速度和规模,而不是替代人类的判断。把聊天程序当成一个高效的文本生成器,反而能更清楚地看到它的能力边界。技术向前跑的速度很快,哲学的提问方式倒是一直没变。输出再完美,也代替不了知道为什么……