網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

《大西洋月刊》丨陶哲軒：數(shù)學(xué)的邊界

2026-02-25 10:42:15　來(lái)源: 邸報(bào)

上海舉報(bào)

分享至

The Edge of Mathematics

傳奇數(shù)學(xué)家陶哲軒闡釋生成式人工智能的前景。

作者：馬特奧·王 (Matteo Wong)

插圖：《大西洋月刊》繪制。圖片來(lái)源：Kimberly White / Getty Images

2026年2月24日

在過(guò)去的幾個(gè)月里，幾位研究人員開(kāi)始提出一個(gè)相同的挑釁性主張：他們利用生成式人工智能工具解決了一個(gè)此前未解的數(shù)學(xué)難題。

那些最極端的承諾——即人工智能輔助解決數(shù)學(xué)界一些最棘手的問(wèn)題——很可能最終被證明是空洞的炒作。但是，許多由人工智能撰寫的解答（盡管針對(duì)的是遠(yuǎn)沒(méi)那么受贊譽(yù)的問(wèn)題）已經(jīng)通過(guò)了驗(yàn)證。這些答案針對(duì)的是“埃爾德什問(wèn)題”（Erd?s Problems）中的一部分——這是由匈牙利數(shù)學(xué)家保羅·埃爾德什（Paul Erd?s）提出的1000多個(gè)數(shù)學(xué)問(wèn)題——是利用包括ChatGPT在內(nèi)的生成式人工智能模型寫成的。OpenAI迅速宣布了一場(chǎng)勝利：“GPT-5.2 Pro解決了另一個(gè)開(kāi)放的埃爾德什問(wèn)題，”O(jiān)penAI總裁格雷格·布羅克曼（Greg Brockman）于一月份在X平臺(tái)上發(fā)帖稱，“這將是數(shù)學(xué)和科學(xué)進(jìn)步狂野的一年！”

圍繞這一新聞的大部分興奮之情，源于這些人工智能所寫證明的裁決者：陶哲軒。他是加州大學(xué)洛杉磯分校（UCLA）的教授，被廣泛認(rèn)為是當(dāng)今世界上最偉大的在世數(shù)學(xué)家。他的認(rèn)可似乎賦予了生成式人工智能最大的承諾以合法性——即推動(dòng)人類知識(shí)和文明的邊界。當(dāng)我本月早些時(shí)候致電陶哲軒，詢問(wèn)他對(duì)人工智能能為數(shù)學(xué)帶來(lái)什么的看法時(shí)，他的態(tài)度更為溫和。他告訴我，人工智能生成的埃爾德什問(wèn)題解答令人印象深刻，但并非壓倒性的：陶哲軒表示，這些機(jī)器人實(shí)際上只是取得了一些“廉價(jià)的勝利”。

陶哲軒長(zhǎng)期以來(lái)對(duì)人工智能工具能為他的領(lǐng)域做些什么感到好奇，但也持保留態(tài)度。我們?cè)?024年秋季第一次交談時(shí)，陶哲軒將聊天機(jī)器人比作“平庸但并非完全無(wú)能”的研究生。大約六個(gè)月后，他告訴我，這些模型在“某些類型的高層數(shù)學(xué)推理”方面有所進(jìn)步，但缺乏創(chuàng)造力且會(huì)犯細(xì)微的錯(cuò)誤。但在我們最近的談話中，他的態(tài)度更加樂(lè)觀。人工智能或許尚未處于解決世界上所有偉大數(shù)學(xué)問(wèn)題的邊緣，但聊天機(jī)器人已經(jīng)達(dá)到了可以與人類數(shù)學(xué)家協(xié)作的水平。他說(shuō)，在這個(gè)過(guò)程中，這項(xiàng)技術(shù)正在開(kāi)辟一種不同的“做數(shù)學(xué)的方式”。

本次對(duì)話經(jīng)過(guò)編輯，以求簡(jiǎn)練清晰。

馬特奧·王： 最近，關(guān)于ChatGPT解決某些埃爾德什問(wèn)題的能力引起了極大轟動(dòng)。在過(guò)去一年左右的時(shí)間里，您看到生成式人工智能的數(shù)學(xué)能力是如何演變的？

陶哲軒： 有一大群人非常、非常希望看到人工智能的成功故事。與此同時(shí)，也有另一群截然相反的人想要抹殺所有人工智能的進(jìn)展。而事實(shí)介于兩者之間，是一個(gè)非常復(fù)雜且微妙的故事。

特別是在這些埃爾德什問(wèn)題中，有一小部分是我們要真正解決的高知名度問(wèn)題，然后還有長(zhǎng)長(zhǎng)的尾部，由非常冷僻的問(wèn)題組成。人工智能非常擅長(zhǎng)系統(tǒng)地探索這個(gè)長(zhǎng)尾部分，并攻克其中最簡(jiǎn)單的問(wèn)題。但這與人類的風(fēng)格截然不同。人類不會(huì)系統(tǒng)地瀏覽所有1000個(gè)問(wèn)題并挑選出最簡(jiǎn)單的12個(gè)來(lái)研究，而這正是人工智能正在做的事情。

這些問(wèn)題之間確實(shí)存在著巨大的難度差異。看看迄今為止人工智能獨(dú)立解決的問(wèn)題，你會(huì)發(fā)現(xiàn)：哦，好吧，它們使用的是一種標(biāo)準(zhǔn)技術(shù)。如果一位專家花半天時(shí)間研究此事，也能解決出來(lái)。當(dāng)然也有更復(fù)雜的、由人工智能輔助的解決方案。我認(rèn)為在短期內(nèi)，我們將通過(guò)純?nèi)斯ぶ悄芊椒ㄔ诤?jiǎn)單問(wèn)題上獲得許多快速勝利。而在接下來(lái)的幾個(gè)月里，我認(rèn)為我們將看到各種形式的人機(jī)混合貢獻(xiàn)。

我也從出現(xiàn)的一些證明中學(xué)習(xí)。我喜歡閱讀它們——也許它使用了某篇1960年論文中的技巧，而我之前并不知曉。所以它可能不是超級(jí)、超級(jí)有創(chuàng)造力，但它是新的，并且能做到那些審視該問(wèn)題的人類專家所忽略的事情。

王：您曾寫道，當(dāng)人類數(shù)學(xué)家面對(duì)一個(gè)新問(wèn)題時(shí)，無(wú)論成功與否，他們都會(huì)產(chǎn)生見(jiàn)解供該領(lǐng)域的其他人構(gòu)建基礎(chǔ)——這是基于人工智能的證明所無(wú)法提供的。為什么會(huì)這樣？

陶哲軒： 這些問(wèn)題就像是你需要徒步前往的遙遠(yuǎn)地點(diǎn)。在過(guò)去，你必須踏上一段旅程。你可以放下路標(biāo)供他人跟隨，也可以繪制地圖。

人工智能工具就像是用直升機(jī)把你直接空降到目的地。你錯(cuò)過(guò)了旅程本身的所有益處。你直接到達(dá)了終點(diǎn)，而這實(shí)際上只是解決這些問(wèn)題價(jià)值的一部分。

王：當(dāng)您思考當(dāng)今這些模型的能力時(shí)，除了讓非數(shù)學(xué)家能夠處理更高級(jí)的問(wèn)題外，它們還能為您的領(lǐng)域做出什么貢獻(xiàn)？

陶哲軒： 如今有很多非常乏味的數(shù)學(xué)工作是我們不喜歡做的，所以我們尋找巧妙的方法來(lái)繞過(guò)它們。但人工智能會(huì)很樂(lè)意猛沖通過(guò)這些繁瑣的計(jì)算。當(dāng)我們把人工智能整合到人類的工作流程中時(shí)，我們就可以滑過(guò)這些障礙。

我還認(rèn)為數(shù)學(xué)家將開(kāi)始在更大的規(guī)模上進(jìn)行數(shù)學(xué)研究。想想科學(xué)研究中個(gè)案研究與人口調(diào)查之間的區(qū)別。如果你要在18世紀(jì)研究一種疾病，如果這是一種罕見(jiàn)病，你可能會(huì)研究一位患有此病的病人，記錄其所有癥狀并做詳盡的筆記。但在21世紀(jì)，你可以進(jìn)行臨床試驗(yàn)，給1000人用藥，進(jìn)行統(tǒng)計(jì)分析，從而獲得關(guān)于藥物效率更精確的信息。

數(shù)學(xué)仍然很大程度上處于個(gè)案研究的水平。一篇論文會(huì)選取一兩個(gè)問(wèn)題，以一種非常手工打造、高強(qiáng)度的方式對(duì)其進(jìn)行透徹研究。這是我們的風(fēng)格。但人工智能工具實(shí)現(xiàn)的是“群體研究”。

王：您對(duì)人工智能模型在數(shù)學(xué)能力方面取得的進(jìn)步感到驚訝嗎？

陶哲軒： 有一點(diǎn)驚訝。發(fā)生的很多事情是我預(yù)料到的，但它們比我預(yù)期的時(shí)間表稍微提前了一點(diǎn)。并沒(méi)有提前太多。

例如，在2023年，我為微軟寫了一篇文章，預(yù)測(cè)到2026年，人工智能將成為值得信賴的合著者——即其對(duì)技術(shù)論文的貢獻(xiàn)將達(dá)到合著者的水平。那篇文章反響不一：有人說(shuō)我太過(guò)雄心勃勃，也有人說(shuō)我太過(guò)悲觀。但我認(rèn)為這基本上幾乎完全符合時(shí)間表。我們基本上看到人工智能的使用水平達(dá)到了我預(yù)期初級(jí)人類合著者所能做出的貢獻(xiàn)，尤其是那些非常樂(lè)意做苦差事并解決大量繁瑣案例的合著者。

王：在未來(lái)一兩年內(nèi)，您希望或期待生成式人工智能模型有哪些改進(jìn)？

陶哲軒： 我們需要找到一個(gè)中間地帶，既鼓勵(lì)負(fù)責(zé)任地使用人工智能，又阻止不負(fù)責(zé)任的使用。這是一條需要小心行走的界線。但我們以前做到過(guò)。數(shù)學(xué)家經(jīng)常使用計(jì)算機(jī)進(jìn)行數(shù)值工作，當(dāng)計(jì)算機(jī)輔助證明首次出現(xiàn)時(shí)，最初遭到了很多反對(duì)，因?yàn)槿藗冑|(zhì)疑如何信任計(jì)算機(jī)代碼？但我們?cè)?0或30年里解決了這個(gè)問(wèn)題。不幸的是，現(xiàn)在的時(shí)間表被大大壓縮了。所以我們必須在幾年內(nèi)制定出我們的標(biāo)準(zhǔn)。而我們的社區(qū)通常不會(huì)移動(dòng)得那么快。

有一件非常基本的事情可以幫助數(shù)學(xué)社區(qū)：當(dāng)人工智能給你一個(gè)問(wèn)題的答案時(shí)，通常它不會(huì)很好地表明它對(duì)這個(gè)答案有多大的把握，或者它總是會(huì)說(shuō)：“我完全確定這是真的。”人類也會(huì)這樣做。無(wú)論他們對(duì)某事是否有信心，這都是非常重要的信息。暫時(shí)提出一些你不確定的事情是可以的，但重要的是要標(biāo)記出你對(duì)此不確定。然而，人工智能工具并不能準(zhǔn)確地評(píng)估它們自己的置信度。這降低了它們的有用性。我們會(huì)更欣賞誠(chéng)實(shí)的人工智能。

此外，許多人工智能公司癡迷于“一鍵式”、完全自主的工作流程：你把任務(wù)交給人工智能，然后你去喝杯咖啡，回來(lái)時(shí)問(wèn)題就解決了。這實(shí)際上并不理想。對(duì)于困難的問(wèn)題，你真正想要的是人類與人工智能之間的對(duì)話。而人工智能公司并沒(méi)有真正促進(jìn)這種互動(dòng)。

如果我們能與至少一些愿意開(kāi)發(fā)更多互動(dòng)平臺(tái)的技術(shù)公司合作，那將會(huì)更容易被人們所接受。我們不想淪為只是按按鈕的角色。

說(shuō)明：本號(hào)刊發(fā)來(lái)自各方的文章，是為了獲得更全面的信息，不代表本號(hào)支持文章中的觀點(diǎn)。由于微信公眾號(hào)每天只能推送一次，本站目前在騰訊新聞發(fā)布最新的文章，每天24小時(shí)不間斷更新，請(qǐng)?jiān)隍v訊新聞中搜索“邸鈔”，或在瀏覽器中點(diǎn)擊：

https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.