预计阅读时间：9分钟22秒

数学家的眼睛与其中的审美

数学之美是真实存在的吗？还是说，它只是一种人类主观的“哇”，而这种感受在 AI 时代正变得多余？

原作者：Rita Ahmadi ，编辑：Richard Fisher

七月里一个炎热的日子，我坐公交前往伦敦的布卢姆茨伯里。英国图书馆、大英博物馆、London Review Bookshop，我常常因为这些地方来到这里。布卢姆茨伯里对我来说不仅仅是一个地点，它更像是走进了一件艺术作品——也许像是弗吉尼亚·伍尔夫的某篇小说，或者邓肯·格兰特的一幅画。

而这一次，我是为数学而来：来听伦敦数学学会（LMS）的哈代讲座。这一讲座以 G H 哈代命名。他曾是剑桥大学数学教授、布卢姆茨伯里派成员，也曾担任伦敦数学学会主席。你或许在电影《知无涯者》（The Man Who Knew Infinity, 2015）里见过他，片中由杰瑞米·艾恩斯饰演。

2025 年的讲者是来自巴尔的摩约翰斯·霍普金斯大学的 Emily Riehl。她讲的是一种复杂的数学“语言”——无穷范畴论：我们能否把它教给计算机，让计算机真正理解它？如果成功，计算机程序就可能在这一领域验证证明，甚至构造复杂结构。

在我左前方几排的位置，我认出了 Kevin Buzzard——他穿着数学家圈子里颇有名气的那条五彩斑斓、图案夸张的裤子。Buzzard 任职于伦敦帝国理工学院，正在开发一个名为 Lean 的计算机证明助手。他对这件事的兴趣带有很强的个人色彩：在与一位同事就一个有缺陷的证明长期争论之后，他失去了对“人类数学家”的信任——正如他自己经常说的那样。他如今的使命，是说服所有数学家都用 Lean 来书写证明。在一次讲座后的问答中，谈到数学中的“真理”与“美”之争时，他说：“我拒绝美，我要严谨。”不过，他鲜艳的穿衣风格似乎又透露出另一面。

人们对 AI 驱动的数学方法的兴趣呈指数级增长，许多数学家已经离开传统学术研究，转而探索它的潜力。最近，一组杰出的数学家设计了 10 个仍在活跃研究中的高阶数学问题，交给 AI 去尝试解决。写作本文时，已有多家 AI 公司和研究者声称找到了答案，而这些结果仍在接受学术共同体的评估。

坐在布卢姆茨伯里的讲座厅里，我望着那块哈代纪念牌，不禁在想：如果是哈代，他会觉得 AI 生成的证明是美的吗？我并不确定。哈代相信，数学中应当有一种强烈的审美判断。他把数学与诗歌相提并论，并主张：美是检验优秀数学的第一标准。他甚至说，丑陋的数学在世界上不可能拥有永久的位置。

如果今天你去问很多数学家，他们依然会谈论某一种方法相对于另一种方法在审美上的吸引力。

但我们所处的世纪已经不同于哈代和他的布卢姆茨伯里同代人。我们的技术、方法乃至整个知识环境都变了。所以，也许我们需要更清楚地界定：所谓“数学之美”究竟是什么。回顾数学史可以发现，严谨性与对美的追求，其实一直共同塑造着数学本身。那么，如果我们真的要用“计算机辅助的真理与严谨性追求”来完全替代这一点，我们至少应当知道，我们究竟要放弃什么——如果真的有东西被放弃的话。数学之美是否像文学与艺术中的美？还是说，它其实是另一种东西？

定义一种观念本来就不容易，尤其是“美”。与其直接说清它是什么，不如先说清它不是什么，通常更容易一些。你未必因此就彻底开悟，但至少能在黑暗中看见一点光。于是，我们就先从“它不是什么”开始，借一个并不那么美的证明例子，来展开这项抽象的描述工作：所谓“图着色问题”的证明。

着色问题属于图论。图论是数学的一个分支，研究的是由节点以及节点之间的边所构成的结构。现实生活和科学中的许多复杂问题，都可以被聪明地转化为具有某种性质的图来处理。

地图着色问题也许是其中最著名的一个例子。这个问题问的是：给定一张由国家组成的地图，如果要求任何两个有共同边界的国家不能涂成同一种颜色，那么至少需要多少种颜色？

为了更直观地理解这一点，设想一个有四个节点的图——我们能否只用两种颜色给这个图的各个区域着色？如果不能，那么至少需要多少种颜色？

由于这个图只有四个节点，你完全可以把所有可能的情况都试一遍。你会发现，仅用两种颜色是不可能完成着色的，因为总会有两个三角形被迫涂成同一种颜色，而它们又共享一条边，这就违反了条件。如果你增加节点数或边数，再去问同样的问题，你依然可以采取相同的办法——把所有组合都试一遍。你可能需要很多张纸、很多颜色、很多天，甚至还需要几个助手来帮你核查是否所有情况都考虑到了。尽管这种方式效率低，也谈不上优雅，但从原则上说，它是可行的。

这也正是为什么数学家会一遍又一遍地证明同一个定理：他们在寻找一个美的证明。

所有数学家都会承认，这样的证明是正确的；如果解题者做得不错，他们甚至会说一句：“做得好！”但是，无论古今，没有哪个数学家会对这样的证明露出会心一笑，或者发出一声“哇”。

这种反应并不是刻意为之，而是品味问题。把所有组合都试完，这种方法缓慢、笨重、过于平铺直叙。它没有提供一个新的视角，也没有建立一种富有洞见的思想或技巧。数学家不会觉得这种证明优雅、美丽或崇高——除非，在对节点数和边数进行归纳时，某种模式浮现出来，或者某个洞见被激发出来。即便如此，真正带来美感的也不是归纳本身，而是那个洞见、那个被发现的模式，或者建立在其上的未来视角。

英语使用者对于简单陈述句“It rains”（下雨了）通常不会觉得有什么美感；但当他们读到亨利·沃兹沃斯·朗费罗在《雨天》（The Rainy Day, 1841）中的诗句时，就会感受到某种不同的东西：

我的生命寒冷、黑暗而凄凉；雨一直下着，风也从不疲倦；

在数学中，你追求的是一种非凡的图景。你不想看到平常之物。哪怕你用一种寻常的方法或图景证明了某个命题的存在，你内心仍不会真正满足。

这也正是为什么数学家会反复证明同一个定理：他们在寻找一个美的证明。这和反复临摹《最后的晚餐》、或者一遍遍雕刻《大卫》并不相同。现象——比如“下雨”——是相同的，但每一首诗都绘出了不同的图景，或者揭示出不同的角度，因此也唤起了不同的感受。

把数学看作诗意之物的，并不只有哈代。20 世纪匈牙利数学家保罗·厄尔德什同样相信数学中的审美判断。他认为，上帝把所有定理的完美证明都保存在一本书里，厄尔德什把它称为“那本书”（THE BOOK）。厄尔德什本人并不信神。1985 年的一次演讲中，他把上帝当作一个隐喻，并说：你不必相信上帝，但作为数学家，你当然应该相信“那本书”。厄尔德什在完成自己版本的这本假想之书之前就去世了，但其中大多数证明都是由他亲自挑选或重写的，并在他去世后以《来自“那本书”的证明》（Proofs from THE BOOK, 1998）出版。因此，厄尔德什心中的“那本书”，其实正是他对优雅而美丽的证明的刻画：仿佛有一只更高的手早已把它们写好，而我们要做的只是把它们发现出来。

数学家和物理学家常常会炫耀自己的“厄尔德什数”，也就是他与你在合作关系上的隔离度。也许这不仅显示你与厄尔德什本人的接近程度，也在某种意义上显示你离那位传说中接触过“终极版本的那本书”的人有多近。

厄尔德什的视角与柏拉图的“理念论”是相连的。与审美的主观主义理论相反，这种看法设想有一个完美世界，那里包含了我们这个不完美世界中的一切美与柏拉图式理念。我们永远无法真正抵达那些完美形式，但可以通过我们的理论、对象、证明，以及一切能够想象的事物，逐渐逼近它们。

因此，对“美”的讨论不应只局限于证明。毕竟，数学中还有其他技巧、洞见、定理等对象，我把它们统称为“数学结构”。

例如，一个命题在正式意义上叫作“猜想”。当人们能为某个猜想提供证据，或者更准确地说提供一个证明时，它就成为“定理”；如果这个定理并不特别重大，它就常被称为“引理”。一些定理始终没有被解决，因此依然停留在猜想状态。如果数学共同体判断某个猜想很难证明，它就会成为一个“开放问题”。

那么，如果对于地图着色问题，人们找到的不是一个美的证明，而是一个美的猜想、算法或策略，会怎样？这个问题在数学史上可谓跌宕起伏，戏剧性十足。1852 年，弗朗西斯·格思里在给英格兰地图上色时，提出了一个猜想：为了给任意一张地图着色，并保证任意两个共边界国家颜色不同，至多只需要四种颜色——也就是四色猜想。

这个猜想是由格思里的兄弟转告给奥古斯都·德·摩根的——伦敦数学学会的大楼就是以他命名的。格思里的兄弟当时正在伦敦大学学院学习。后来，德·摩根又把这个问题告诉了威廉·罗恩·哈密顿，哈密顿再告诉阿瑟·凯莱，最后凯莱在伦敦数学学会上正式公布了这个问题。1879 年，阿尔弗雷德·肯普发表论文，声称自己已经证明了该结果。凭借这项成果，他后来当选英国皇家学会会士，并进一步担任伦敦数学学会主席。

1890 年，人们发现这个证明是错误的。但错误并不总是毫无价值。珀西·约翰·希伍德找出了肯普论证中的漏洞，并利用肯普的方法证明了“五色问题”。四色问题则继续悬而未决，整整一个世纪，直到 1977 年才借助计算机软件最终得证。这也标志着计算机辅助证明时代的开启。

这种证明使用了一种“放电法”（discharging method）：大致来说，计算机程序先找出所有可能的构型，把它们转化为由点和线连接而成的网络，然后给每个点分配一个数值（即“电荷”），再依据某些条件在点之间转移这些数值。核心洞见在于：如果一张地图真的需要超过四种颜色，那么这些数值在与欧拉示性公式——一个用于分析网络的基本方程——进行核对时，就无法正确平衡。算法当然可以做得更加复杂、更加高效，但无论怎样变形，它都在某种程度上离不开计算机的参与。

你会觉得这是一种美的证明吗？过去几个月里，我问了许多资深数学家同样的问题：他们是否拥有某种判断标准，或者一本“规则手册”，来决定什么样的数学结构是美的，以及如何发现它们。答案并不直接，而且出人意料地彼此不同。但大多数人都提到：一段美的数学，应当是简单的。

“你所说的简单，是什么意思？”我一次次追问。而这恰恰是分歧最明显的一点。不同数学家——哪怕是在同一个领域工作——对“简单”的理解也并不相同。有人指的是证明的行数少；有人指的是它的自足性，比如几乎不需要援引其他引理；有人指的是证明思路本身的简洁，甚至是定理表述本身的简洁。举例来说，一个定理的核心思想是否足够简单，以至于一个外行人也能被解释清楚、并真正理解？哪怕其技术细节和完整证明本身依旧复杂，需要训练和数学知识才能掌握。

我认为，简单是美的第一重味道。原因也正如哈代所相信的：数学更像诗，而不是散文。从这个意义上讲，简单并不与数学思想的深度相对立。但如同诗歌，检验标准在于：能否通过对一串词语的精准选取，以一种简洁却深刻的结构，捕捉并表达出一个图景。数学证明的“简单”，说到底是技巧序列的表达方式，而不是那个图景本身。图景本身可以很复杂，但同时仍然透明——这一点我稍后会说明。

在诗歌中，模糊性常常受到赞美；而在数学中，模糊性却会遭到贬斥。数学家并不会试图写出一段故意模糊的数学。事实上，透明性恰恰是检验数学中“简单”是否恰到好处的一个试纸。简单性的一个目标，就是减少歧义、生成透明性。这里所说的“歧义”，并不是指读者能力不足。比如一个外行人说安德鲁·怀尔斯 1995 年对费马大定理的证明“很模糊”，这种判断本身并不能算数，因为这里的问题在于读者能力不够，而不是证明本身有问题。但如果一个原本简单的结构是被故意设计成模糊的，那它就是一首诗，而不是一段数学。

那到底是哪一种“简单”？是陈述的简单？思想的简单？还是技巧运用的简单？也许三者都参与其中；一个美的数学结构，可能在某种程度上同时兼具这些维度。但并不是所有简单的东西都被认为是美的。回到诗歌的类比，并不是每一串由简单词语构成的简单句子，都能成为一首美的诗。在塞西尔·戴-刘易斯的《诗的意象》（The Poetic Image, 1947）中，他说，一连串天真无辜、甚至表面上互不相干的词语，可能会因为它们所构造出的图景与隐喻，而唤起最强烈的感受。他举了罗伯特·勃朗宁《山庄之上——城市之下》（Up at a Villa – Down in the City, 1855）中的诗句：

那野郁金香在花管尽头，鼓起它那硕大的红钟，像一团薄而清澈的血泡，供孩子们摘下去卖。

戴-刘易斯赞赏的是其中的技巧：把玻璃吹制的动作转化成了一个感官性的图景；但对他来说，当他读到“孩子们”这个词时，图景突然转向了另一个、更富情绪张力的方向。变化的不只是画面，还有反应与情感的性质。词语“孩子们”本身简单、无辜，但它被放进这个图景之后，就把它转变成了一种复杂的、并不协调的画面，从而唤起了不同层次的情感反应。在这里，诗的意象是深刻的、多层次的、带有情绪张力的，而结构与词语却依旧简单。

在数学里，也会出现类似的情况：一系列简单的引理或定义，能够生成一个复杂而美的思想或图景。以“罗素悖论”为例——它由伯特兰·罗素在 20 世纪初指出，内容是：所谓“全集”并不存在。这个悖论意义重大，它动摇了数学的基础。围绕它的哲学含义，人们写下了大量著作；而一些替代性的数学元语言，也部分是在回应它的过程中发展出来的，例如范畴论和类型论。在这个例子里，命题本身和证明都很简单，只要掌握少数几个直观概念，就能理解它。但它所揭示出的图景，却深刻得多，也更具基础性。

论证过程如下。

在数学中，集合就是一些对象构成的整体，这些对象有时共享某种共同性质。我们通常想到的大多数集合，都不是它们自身的成员。比如，“所有猫构成的集合”本身并不是一只猫，所以它并不包含自己。

现在让我们设想，存在一个集合，叫作 R，它包含所有那些“不包含自身”的集合。用数学记号写出来，就是：

R = {x | x ∉ x}

那么，R 本身呢？R 包含 R 吗？还是不包含？
答案是：两者都不是。

我们可以用反证法证明，这样一个集合根本不可能存在。首先，假设 R 是自己的成员。根据定义，凡是 R 的成员，都必须“不包含自己”，因此这就不成立。但如果说 R 不是自己的成员，也同样不行。因为这样一来，R 就恰好满足被收入 R 的定义条件——它是一个“不包含自己”的集合。所以，R 必须属于 R，这又与原来的假设矛盾。

因此，一个按这种方式定义的集合——即“包含所有不包含自身之集合的集合”——是不存在的。由此可知，一个包含所有集合、并且包含自身的“全集”也是不存在的。

与此相反，还有另一种情形：一个数学陈述或定理本身非常简单，但它背后的证明、思想和技巧却极其复杂。费马大定理就是一个例子。它说的是：对于任意整数 n > 2，不存在三个正整数 a, b, c 使得下式成立：

aⁿ + bⁿ = cⁿ

这个命题简单到 10 岁的安德鲁·怀尔斯当年就能读懂、理解，甚至因此立志终生要把它证明出来。但为了最终解决它——不仅是怀尔斯自己，也包括他之前一代代数学家——人们花了多年时间去学习、发明代数数论中高度复杂的新技术。即便到了今天，真正能欣赏怀尔斯证明之美的人，依然只是少数。

罗素悖论和费马大定理不仅都很简单，它们还都带来一种“出人意料”的感受——而我认为，这正是美的第二个特征。与“简单”一样，“惊异”也没有一种固定不变的解释。我甚至认为，它更难被形式化。某一领域中的数学家，往往已经习惯了某些证明技巧、引理和基础定理。这基本上就是他们的主要工具箱。说得稍微朴素一点，作为一个数学家，你的工作就是挑出相关的工具，并按照逻辑要求把它们组织成有意义的序列。

其中一种令人惊异的时刻，是你试图在代数学中证明一个定理，却借来几何学中的一种技巧，再把它重新组织，使它在代数学中也变得有效且相关。

从其他学科借用技巧，是另一种“魔法时刻”。许多数学家会借用物理学中的方法——包括量子引力中的技术——去证明几何学或拓扑学中的定理；他们会把其中所有物理性的内容剥离掉，只留下最核心的数学论证。这之所以令人惊异，是因为并不是很多人都能在物理学中识别出一个复杂论证，完整理解它，看穿它，剪去多余的枝蔓，再从中提炼出本质。

这些“手法”之所以能引发敬畏，是因为它们本质上超出了预期。它需要一种“眼光”。但并不是每一双眼睛都能捕捉到这一点；经验或许能发挥作用，但经验本身还不够。为此，我认为还需要一种东西——就像诗歌中所要求的那样：生命力。

数学结构中的生命力，不会枯死，也不会孤立。它会移动，会激发，会创造——它是活着的。

戴-刘易斯曾提出：一个对象本身并不是天然就具有诗性的；它之所以成为诗性的，是因为诗人。优秀的诗人具有很高的生命力；他们活在当下。或者像文学学者约翰·利文斯顿·洛斯所说的那样，他们不会“像寄居蟹一样，一代又一代地把自己缩进前人丢弃的壳里”。他们用一双新鲜的眼睛观察世界，以便钉住一个原创性的思想。

事实上，他们所看见的意象之原创性，和他们的生命力、以及他们与当下时刻的连接程度直接相关。对象之所以变得鲜明地具有诗性，正是因为他们活在这一时刻中的在场。

数学对象、数学技巧、各种引理，其实也是一样的。有时候，一位经验丰富、技术娴熟的数学家甚至对这些东西倒背如流，每年都在讲授它们。他们会慷慨地向年轻数学家介绍开放问题，并耐心分享自己的全部进展细节。

然而，真正看到那个原创图景、或者看到一条仿佛来自“那本书”的证明的人，却可能是一个刚刚博士毕业的新手。我认为，这是因为他们拥有更高的生命力。而这又进一步赋予了数学结构本身一种生命力：这种结构不会死去，也不会变得孤立。它会运动，会激发，会创造——归根到底，它是活的。

最后，我对数学之美的定义大致会是这样：一种简单的数学结构，它能让最有经验的数学家也感到惊异，并传递出一种生命力。

但问题在于：AI 辅助生成的证明，算不算简单？算不算令人惊异？我们又该如何在机器中定义“生命力”？对于这些问题，目前尚无定论。我自己也很摇摆。也许模型只需要接受更多训练，就能匹配我们的创造力。但我也在想，我们的边缘系统是否是必要的？没有情感上的触动，我们还能写出证明吗？

我同样不确定：一个完美高效的大脑，是否真的能提出那种崭新而革命性的思想。

归根结底，这场争论关乎的已不仅仅是审美；它与 AI 辅助数学的发展紧密相连。如果 AI 模型真的能够生成新的数学结构，那么我们应当如何引导它们？我们追求的，究竟是美的结构，还是仅仅真实的结构？这也许会成为未来很多年的引导性问题。

有些数学家说，他们偏好的是“真理”，而且只要“真理”。然而，最近我与数学家的交流让我看到：大多数人其实都会立刻认出一段美的数学、享受它，甚至由衷地露出笑容。事实上，他们的一生，都在追寻这样的东西。