数学家的眼睛与其中的审美
数学之美是真实存在的吗?还是说,它只是一种人类主观的“哇”,而这种感受在 AI 时代正变得多余?
原作者:Rita Ahmadi ,编辑:Richard Fisher
七月里一个炎热的日子,我坐公交前往伦敦的布卢姆茨伯里。英国图书馆、大英博物馆、London Review Bookshop,我常常因为这些地方来到这里。布卢姆茨伯里对我来说不仅仅是一个地点,它更像是走进了一件艺术作品——也许像是弗吉尼亚·伍尔夫的某篇小说,或者邓肯·格兰特的一幅画。
而这一次,我是为数学而来:来听伦敦数学学会(LMS)的哈代讲座。这一讲座以 G H 哈代命名。他曾是剑桥大学数学教授、布卢姆茨伯里派成员,也曾担任伦敦数学学会主席。你或许在电影《知无涯者》(The Man Who Knew Infinity, 2015)里见过他,片中由杰瑞米·艾恩斯饰演。
2025 年的讲者是来自巴尔的摩约翰斯·霍普金斯大学的 Emily Riehl。她讲的是一种复杂的数学“语言”——无穷范畴论:我们能否把它教给计算机,让计算机真正理解它?如果成功,计算机程序就可能在这一领域验证证明,甚至构造复杂结构。
在我左前方几排的位置,我认出了 Kevin Buzzard——他穿着数学家圈子里颇有名气的那条五彩斑斓、图案夸张的裤子。Buzzard 任职于伦敦帝国理工学院,正在开发一个名为 Lean 的计算机证明助手。他对这件事的兴趣带有很强的个人色彩:在与一位同事就一个有缺陷的证明长期争论之后,他失去了对“人类数学家”的信任——正如他自己经常说的那样。他如今的使命,是说服所有数学家都用 Lean 来书写证明。在一次讲座后的问答中,谈到数学中的“真理”与“美”之争时,他说:“我拒绝美,我要严谨。”不过,他鲜艳的穿衣风格似乎又透露出另一面。
人们对 AI 驱动的数学方法的兴趣呈指数级增长,许多数学家已经离开传统学术研究,转而探索它的潜力。最近,一组杰出的数学家设计了 10 个仍在活跃研究中的高阶数学问题,交给 AI 去尝试解决。写作本文时,已有多家 AI 公司和研究者声称找到了答案,而这些结果仍在接受学术共同体的评估。
坐在布卢姆茨伯里的讲座厅里,我望着那块哈代纪念牌,不禁在想:如果是哈代,他会觉得 AI 生成的证明是美的吗?我并不确定。哈代相信,数学中应当有一种强烈的审美判断。他把数学与诗歌相提并论,并主张:美是检验优秀数学的第一标准。他甚至说,丑陋的数学在世界上不可能拥有永久的位置。
如果今天你去问很多数学家,他们依然会谈论某一种方法相对于另一种方法在审美上的吸引力。
但我们所处的世纪已经不同于哈代和他的布卢姆茨伯里同代人。我们的技术、方法乃至整个知识环境都变了。所以,也许我们需要更清楚地界定:所谓“数学之美”究竟是什么。回顾数学史可以发现,严谨性与对美的追求,其实一直共同塑造着数学本身。那么,如果我们真的要用“计算机辅助的真理与严谨性追求”来完全替代这一点,我们至少应当知道,我们究竟要放弃什么——如果真的有东西被放弃的话。数学之美是否像文学与艺术中的美?还是说,它其实是另一种东西?
定义一种观念本来就不容易,尤其是“美”。与其直接说清它是什么,不如先说清它不是什么,通常更容易一些。你未必因此就彻底开悟,但至少能在黑暗中看见一点光。于是,我们就先从“它不是什么”开始,借一个并不那么美的证明例子,来展开这项抽象的描述工作:所谓“图着色问题”的证明。
着色问题属于图论。图论是数学的一个分支,研究的是由节点以及节点之间的边所构成的结构。现实生活和科学中的许多复杂问题,都可以被聪明地转化为具有某种性质的图来处理。
地图着色问题也许是其中最著名的一个例子。这个问题问的是:给定一张由国家组成的地图,如果要求任何两个有共同边界的国家不能涂成同一种颜色,那么至少需要多少种颜色?

为了更直观地理解这一点,设想一个有四个节点的图——我们能否只用两种颜色给这个图的各个区域着色?如果不能,那么至少需要多少种颜色?
由于这个图只有四个节点,你完全可以把所有可能的情况都试一遍。你会发现,仅用两种颜色是不可能完成着色的,因为总会有两个三角形被迫涂成同一种颜色,而它们又共享一条边,这就违反了条件。如果你增加节点数或边数,再去问同样的问题,你依然可以采取相同的办法——把所有组合都试一遍。你可能需要很多张纸、很多颜色、很多天,甚至还需要几个助手来帮你核查是否所有情况都考虑到了。尽管这种方式效率低,也谈不上优雅,但从原则上说,它是可行的。
这也正是为什么数学家会一遍又一遍地证明同一个定理:他们在寻找一个美的证明。
所有数学家都会承认,这样的证明是正确的;如果解题者做得不错,他们甚至会说一句:“做得好!”但是,无论古今,没有哪个数学家会对这样的证明露出会心一笑,或者发出一声“哇”。
这种反应并不是刻意为之,而是品味问题。把所有组合都试完,这种方法缓慢、笨重、过于平铺直叙。它没有提供一个新的视角,也没有建立一种富有洞见的思想或技巧。数学家不会觉得这种证明优雅、美丽或崇高——除非,在对节点数和边数进行归纳时,某种模式浮现出来,或者某个洞见被激发出来。即便如此,真正带来美感的也不是归纳本身,而是那个洞见、那个被发现的模式,或者建立在其上的未来视角。
英语使用者对于简单陈述句“It rains”(下雨了)通常不会觉得有什么美感;但当他们读到亨利·沃兹沃斯·朗费罗在《雨天》(The Rainy Day, 1841)中的诗句时,就会感受到某种不同的东西:
我的生命寒冷、黑暗而凄凉; 雨一直下着,风也从不疲倦;
在数学中,你追求的是一种非凡的图景。你不想看到平常之物。哪怕你用一种寻常的方法或图景证明了某个命题的存在,你内心仍不会真正满足。
这也正是为什么数学家会反复证明同一个定理:他们在寻找一个美的证明。这和反复临摹《最后的晚餐》、或者一遍遍雕刻《大卫》并不相同。现象——比如“下雨”——是相同的,但每一首诗都绘出了不同的图景,或者揭示出不同的角度,因此也唤起了不同的感受。
把数学看作诗意之物的,并不只有哈代。20 世纪匈牙利数学家保罗·厄尔德什同样相信数学中的审美判断。他认为,上帝把所有定理的完美证明都保存在一本书里,厄尔德什把它称为“那本书”(THE BOOK)。厄尔德什本人并不信神。1985 年的一次演讲中,他把上帝当作一个隐喻,并说:你不必相信上帝,但作为数学家,你当然应该相信“那本书”。厄尔德什在完成自己版本的这本假想之书之前就去世了,但其中大多数证明都是由他亲自挑选或重写的,并在他去世后以《来自“那本书”的证明》(Proofs from THE BOOK, 1998)出版。因此,厄尔德什心中的“那本书”,其实正是他对优雅而美丽的证明的刻画:仿佛有一只更高的手早已把它们写好,而我们要做的只是把它们发现出来。
数学家和物理学家常常会炫耀自己的“厄尔德什数”,也就是他与你在合作关系上的隔离度。也许这不仅显示你与厄尔德什本人的接近程度,也在某种意义上显示你离那位传说中接触过“终极版本的那本书”的人有多近。
厄尔德什的视角与柏拉图的“理念论”是相连的。与审美的主观主义理论相反,这种看法设想有一个完美世界,那里包含了我们这个不完美世界中的一切美与柏拉图式理念。我们永远无法真正抵达那些完美形式,但可以通过我们的理论、对象、证明,以及一切能够想象的事物,逐渐逼近它们。
因此,对“美”的讨论不应只局限于证明。毕竟,数学中还有其他技巧、洞见、定理等对象,我把它们统称为“数学结构”。
例如,一个命题在正式意义上叫作“猜想”。当人们能为某个猜想提供证据,或者更准确地说提供一个证明时,它就成为“定理”;如果这个定理并不特别重大,它就常被称为“引理”。一些定理始终没有被解决,因此依然停留在猜想状态。如果数学共同体判断某个猜想很难证明,它就会成为一个“开放问题”。
那么,如果对于地图着色问题,人们找到的不是一个美的证明,而是一个美的猜想、算法或策略,会怎样?这个问题在数学史上可谓跌宕起伏,戏剧性十足。1852 年,弗朗西斯·格思里在给英格兰地图上色时,提出了一个猜想:为了给任意一张地图着色,并保证任意两个共边界国家颜色不同,至多只需要四种颜色——也就是四色猜想。
这个猜想是由格思里的兄弟转告给奥古斯都·德·摩根的——伦敦数学学会的大楼就是以他命名的。格思里的兄弟当时正在伦敦大学学院学习。后来,德·摩根又把这个问题告诉了威廉·罗恩·哈密顿,哈密顿再告诉阿瑟·凯莱,最后凯莱在伦敦数学学会上正式公布了这个问题。1879 年,阿尔弗雷德·肯普发表论文,声称自己已经证明了该结果。凭借这项成果,他后来当选英国皇家学会会士,并进一步担任伦敦数学学会主席。
1890 年,人们发现这个证明是错误的。但错误并不总是毫无价值。珀西·约翰·希伍德找出了肯普论证中的漏洞,并利用肯普的方法证明了“五色问题”。四色问题则继续悬而未决,整整一个世纪,直到 1977 年才借助计算机软件最终得证。这也标志着计算机辅助证明时代的开启。
这种证明使用了一种“放电法”(discharging method):大致来说,计算机程序先找出所有可能的构型,把它们转化为由点和线连接而成的网络,然后给每个点分配一个数值(即“电荷”),再依据某些条件在点之间转移这些数值。核心洞见在于:如果一张地图真的需要超过四种颜色,那么这些数值在与欧拉示性公式——一个用于分析网络的基本方程——进行核对时,就无法正确平衡。算法当然可以做得更加复杂、更加高效,但无论怎样变形,它都在某种程度上离不开计算机的参与。
你会觉得这是一种美的证明吗?过去几个月里,我问了许多资深数学家同样的问题:他们是否拥有某种判断标准,或者一本“规则手册”,来决定什么样的数学结构是美的,以及如何发现它们。答案并不直接,而且出人意料地彼此不同。但大多数人都提到:一段美的数学,应当是简单的。
“你所说的简单,是什么意思?”我一次次追问。而这恰恰是分歧最明显的一点。不同数学家——哪怕是在同一个领域工作——对“简单”的理解也并不相同。有人指的是证明的行数少;有人指的是它的自足性,比如几乎不需要援引其他引理;有人指的是证明思路本身的简洁,甚至是定理表述本身的简洁。举例来说,一个定理的核心思想是否足够简单,以至于一个外行人也能被解释清楚、并真正理解?哪怕其技术细节和完整证明本身依旧复杂,需要训练和数学知识才能掌握。
我认为,简单是美的第一重味道。原因也正如哈代所相信的:数学更像诗,而不是散文。从这个意义上讲,简单并不与数学思想的深度相对立。但如同诗歌,检验标准在于:能否通过对一串词语的精准选取,以一种简洁却深刻的结构,捕捉并表达出一个图景。数学证明的“简单”,说到底是技巧序列的表达方式,而不是那个图景本身。图景本身可以很复杂,但同时仍然透明——这一点我稍后会说明。
在诗歌中,模糊性常常受到赞美;而在数学中,模糊性却会遭到贬斥。数学家并不会试图写出一段故意模糊的数学。事实上,透明性恰恰是检验数学中“简单”是否恰到好处的一个试纸。简单性的一个目标,就是减少歧义、生成透明性。这里所说的“歧义”,并不是指读者能力不足。比如一个外行人说安德鲁·怀尔斯 1995 年对费马大定理的证明“很模糊”,这种判断本身并不能算数,因为这里的问题在于读者能力不够,而不是证明本身有问题。但如果一个原本简单的结构是被故意设计成模糊的,那它就是一首诗,而不是一段数学。
那到底是哪一种“简单”?是陈述的简单?思想的简单?还是技巧运用的简单?也许三者都参与其中;一个美的数学结构,可能在某种程度上同时兼具这些维度。但并不是所有简单的东西都被认为是美的。回到诗歌的类比,并不是每一串由简单词语构成的简单句子,都能成为一首美的诗。在塞西尔·戴-刘易斯的《诗的意象》(The Poetic Image, 1947)中,他说,一连串天真无辜、甚至表面上互不相干的词语,可能会因为它们所构造出的图景与隐喻,而唤起最强烈的感受。他举了罗伯特·勃朗宁《山庄之上——城市之下》(Up at a Villa – Down in the City, 1855)中的诗句:
那野郁金香在花管尽头,鼓起它那硕大的红钟, 像一团薄而清澈的血泡,供孩子们摘下去卖。
戴-刘易斯赞赏的是其中的技巧:把玻璃吹制的动作转化成了一个感官性的图景;但对他来说,当他读到“孩子们”这个词时,图景突然转向了另一个、更富情绪张力的方向。变化的不只是画面,还有反应与情感的性质。词语“孩子们”本身简单、无辜,但它被放进这个图景之后,就把它转变成了一种复杂的、并不协调的画面,从而唤起了不同层次的情感反应。在这里,诗的意象是深刻的、多层次的、带有情绪张力的,而结构与词语却依旧简单。
在数学里,也会出现类似的情况:一系列简单的引理或定义,能够生成一个复杂而美的思想或图景。以“罗素悖论”为例——它由伯特兰·罗素在 20 世纪初指出,内容是:所谓“全集”并不存在。这个悖论意义重大,它动摇了数学的基础。围绕它的哲学含义,人们写下了大量著作;而一些替代性的数学元语言,也部分是在回应它的过程中发展出来的,例如范畴论和类型论。在这个例子里,命题本身和证明都很简单,只要掌握少数几个直观概念,就能理解它。但它所揭示出的图景,却深刻得多,也更具基础性。
论证过程如下。
在数学中,集合就是一些对象构成的整体,这些对象有时共享某种共同性质。我们通常想到的大多数集合,都不是它们自身的成员。比如,“所有猫构成的集合”本身并不是一只猫,所以它并不包含自己。
现在让我们设想,存在一个集合,叫作 R,它包含所有那些“不包含自身”的集合。用数学记号写出来,就是:
R = {x | x ∉ x}
那么,R 本身呢?R 包含 R 吗?还是不包含?
答案是:两者都不是。
我们可以用反证法证明,这样一个集合根本不可能存在。首先,假设 R 是自己的成员。根据定义,凡是 R 的成员,都必须“不包含自己”,因此这就不成立。但如果说 R 不是自己的成员,也同样不行。因为这样一来,R 就恰好满足被收入 R 的定义条件——它是一个“不包含自己”的集合。所以,R 必须属于 R,这又与原来的假设矛盾。
因此,一个按这种方式定义的集合——即“包含所有不包含自身之集合的集合”——是不存在的。由此可知,一个包含所有集合、并且包含自身的“全集”也是不存在的。
与此相反,还有另一种情形:一个数学陈述或定理本身非常简单,但它背后的证明、思想和技巧却极其复杂。费马大定理就是一个例子。它说的是:对于任意整数 n > 2,不存在三个正整数 a, b, c 使得下式成立:
aⁿ + bⁿ = cⁿ
这个命题简单到 10 岁的安德鲁·怀尔斯当年就能读懂、理解,甚至因此立志终生要把它证明出来。但为了最终解决它——不仅是怀尔斯自己,也包括他之前一代代数学家——人们花了多年时间去学习、发明代数数论中高度复杂的新技术。即便到了今天,真正能欣赏怀尔斯证明之美的人,依然只是少数。
罗素悖论和费马大定理不仅都很简单,它们还都带来一种“出人意料”的感受——而我认为,这正是美的第二个特征。与“简单”一样,“惊异”也没有一种固定不变的解释。我甚至认为,它更难被形式化。某一领域中的数学家,往往已经习惯了某些证明技巧、引理和基础定理。这基本上就是他们的主要工具箱。说得稍微朴素一点,作为一个数学家,你的工作就是挑出相关的工具,并按照逻辑要求把它们组织成有意义的序列。
其中一种令人惊异的时刻,是你试图在代数学中证明一个定理,却借来几何学中的一种技巧,再把它重新组织,使它在代数学中也变得有效且相关。
从其他学科借用技巧,是另一种“魔法时刻”。许多数学家会借用物理学中的方法——包括量子引力中的技术——去证明几何学或拓扑学中的定理;他们会把其中所有物理性的内容剥离掉,只留下最核心的数学论证。这之所以令人惊异,是因为并不是很多人都能在物理学中识别出一个复杂论证,完整理解它,看穿它,剪去多余的枝蔓,再从中提炼出本质。
这些“手法”之所以能引发敬畏,是因为它们本质上超出了预期。它需要一种“眼光”。但并不是每一双眼睛都能捕捉到这一点;经验或许能发挥作用,但经验本身还不够。为此,我认为还需要一种东西——就像诗歌中所要求的那样:生命力。
数学结构中的生命力,不会枯死,也不会孤立。它会移动,会激发,会创造——它是活着的。
戴-刘易斯曾提出:一个对象本身并不是天然就具有诗性的;它之所以成为诗性的,是因为诗人。优秀的诗人具有很高的生命力;他们活在当下。或者像文学学者约翰·利文斯顿·洛斯所说的那样,他们不会“像寄居蟹一样,一代又一代地把自己缩进前人丢弃的壳里”。他们用一双新鲜的眼睛观察世界,以便钉住一个原创性的思想。
事实上,他们所看见的意象之原创性,和他们的生命力、以及他们与当下时刻的连接程度直接相关。对象之所以变得鲜明地具有诗性,正是因为他们活在这一时刻中的在场。
数学对象、数学技巧、各种引理,其实也是一样的。有时候,一位经验丰富、技术娴熟的数学家甚至对这些东西倒背如流,每年都在讲授它们。他们会慷慨地向年轻数学家介绍开放问题,并耐心分享自己的全部进展细节。
然而,真正看到那个原创图景、或者看到一条仿佛来自“那本书”的证明的人,却可能是一个刚刚博士毕业的新手。我认为,这是因为他们拥有更高的生命力。而这又进一步赋予了数学结构本身一种生命力:这种结构不会死去,也不会变得孤立。它会运动,会激发,会创造——归根到底,它是活的。
最后,我对数学之美的定义大致会是这样:一种简单的数学结构,它能让最有经验的数学家也感到惊异,并传递出一种生命力。
但问题在于:AI 辅助生成的证明,算不算简单?算不算令人惊异?我们又该如何在机器中定义“生命力”?对于这些问题,目前尚无定论。我自己也很摇摆。也许模型只需要接受更多训练,就能匹配我们的创造力。但我也在想,我们的边缘系统是否是必要的?没有情感上的触动,我们还能写出证明吗?
我同样不确定:一个完美高效的大脑,是否真的能提出那种崭新而革命性的思想。
归根结底,这场争论关乎的已不仅仅是审美;它与 AI 辅助数学的发展紧密相连。如果 AI 模型真的能够生成新的数学结构,那么我们应当如何引导它们?我们追求的,究竟是美的结构,还是仅仅真实的结构?这也许会成为未来很多年的引导性问题。
有些数学家说,他们偏好的是“真理”,而且只要“真理”。然而,最近我与数学家的交流让我看到:大多数人其实都会立刻认出一段美的数学、享受它,甚至由衷地露出笑容。事实上,他们的一生,都在追寻这样的东西。