The Edge of Mathematics
傳奇數(shù)學(xué)家陶哲軒闡釋生成式人工智能的前景。
作者:馬特奧·王 (Matteo Wong)
![]()
插圖:《大西洋月刊》繪制。圖片來(lái)源:Kimberly White / Getty Images
2026年2月24日
在過(guò)去的幾個(gè)月里,幾位研究人員開(kāi)始提出一個(gè)相同的挑釁性主張:他們利用生成式人工智能工具解決了一個(gè)此前未解的數(shù)學(xué)難題。
那些最極端的承諾——即人工智能輔助解決數(shù)學(xué)界一些最棘手的問(wèn)題——很可能最終被證明是空洞的炒作。但是,許多由人工智能撰寫的解答(盡管針對(duì)的是遠(yuǎn)沒(méi)那么受贊譽(yù)的問(wèn)題)已經(jīng)通過(guò)了驗(yàn)證。這些答案針對(duì)的是“埃爾德什問(wèn)題”(Erd?s Problems)中的一部分——這是由匈牙利數(shù)學(xué)家保羅·埃爾德什(Paul Erd?s)提出的1000多個(gè)數(shù)學(xué)問(wèn)題——是利用包括ChatGPT在內(nèi)的生成式人工智能模型寫成的。OpenAI迅速宣布了一場(chǎng)勝利:“GPT-5.2 Pro解決了另一個(gè)開(kāi)放的埃爾德什問(wèn)題,”O(jiān)penAI總裁格雷格·布羅克曼(Greg Brockman)于一月份在X平臺(tái)上發(fā)帖稱,“這將是數(shù)學(xué)和科學(xué)進(jìn)步狂野的一年!”
圍繞這一新聞的大部分興奮之情,源于這些人工智能所寫證明的裁決者:陶哲軒。他是加州大學(xué)洛杉磯分校(UCLA)的教授,被廣泛認(rèn)為是當(dāng)今世界上最偉大的在世數(shù)學(xué)家。他的認(rèn)可似乎賦予了生成式人工智能最大的承諾以合法性——即推動(dòng)人類知識(shí)和文明的邊界。當(dāng)我本月早些時(shí)候致電陶哲軒,詢問(wèn)他對(duì)人工智能能為數(shù)學(xué)帶來(lái)什么的看法時(shí),他的態(tài)度更為溫和。他告訴我,人工智能生成的埃爾德什問(wèn)題解答令人印象深刻,但并非壓倒性的:陶哲軒表示,這些機(jī)器人實(shí)際上只是取得了一些“廉價(jià)的勝利”。
陶哲軒長(zhǎng)期以來(lái)對(duì)人工智能工具能為他的領(lǐng)域做些什么感到好奇,但也持保留態(tài)度。我們?cè)?024年秋季第一次交談時(shí),陶哲軒將聊天機(jī)器人比作“平庸但并非完全無(wú)能”的研究生。大約六個(gè)月后,他告訴我,這些模型在“某些類型的高層數(shù)學(xué)推理”方面有所進(jìn)步,但缺乏創(chuàng)造力且會(huì)犯細(xì)微的錯(cuò)誤。但在我們最近的談話中,他的態(tài)度更加樂(lè)觀。人工智能或許尚未處于解決世界上所有偉大數(shù)學(xué)問(wèn)題的邊緣,但聊天機(jī)器人已經(jīng)達(dá)到了可以與人類數(shù)學(xué)家協(xié)作的水平。他說(shuō),在這個(gè)過(guò)程中,這項(xiàng)技術(shù)正在開(kāi)辟一種不同的“做數(shù)學(xué)的方式”。
本次對(duì)話經(jīng)過(guò)編輯,以求簡(jiǎn)練清晰。
馬特奧·王: 最近,關(guān)于ChatGPT解決某些埃爾德什問(wèn)題的能力引起了極大轟動(dòng)。在過(guò)去一年左右的時(shí)間里,您看到生成式人工智能的數(shù)學(xué)能力是如何演變的?
陶哲軒: 有一大群人非常、非常希望看到人工智能的成功故事。與此同時(shí),也有另一群截然相反的人想要抹殺所有人工智能的進(jìn)展。而事實(shí)介于兩者之間,是一個(gè)非常復(fù)雜且微妙的故事。
特別是在這些埃爾德什問(wèn)題中,有一小部分是我們要真正解決的高知名度問(wèn)題,然后還有長(zhǎng)長(zhǎng)的尾部,由非常冷僻的問(wèn)題組成。人工智能非常擅長(zhǎng)系統(tǒng)地探索這個(gè)長(zhǎng)尾部分,并攻克其中最簡(jiǎn)單的問(wèn)題。但這與人類的風(fēng)格截然不同。人類不會(huì)系統(tǒng)地瀏覽所有1000個(gè)問(wèn)題并挑選出最簡(jiǎn)單的12個(gè)來(lái)研究,而這正是人工智能正在做的事情。
這些問(wèn)題之間確實(shí)存在著巨大的難度差異。看看迄今為止人工智能獨(dú)立解決的問(wèn)題,你會(huì)發(fā)現(xiàn):哦,好吧,它們使用的是一種標(biāo)準(zhǔn)技術(shù)。如果一位專家花半天時(shí)間研究此事,也能解決出來(lái)。當(dāng)然也有更復(fù)雜的、由人工智能輔助的解決方案。我認(rèn)為在短期內(nèi),我們將通過(guò)純?nèi)斯ぶ悄芊椒ㄔ诤?jiǎn)單問(wèn)題上獲得許多快速勝利。而在接下來(lái)的幾個(gè)月里,我認(rèn)為我們將看到各種形式的人機(jī)混合貢獻(xiàn)。
我也從出現(xiàn)的一些證明中學(xué)習(xí)。我喜歡閱讀它們——也許它使用了某篇1960年論文中的技巧,而我之前并不知曉。所以它可能不是超級(jí)、超級(jí)有創(chuàng)造力,但它是新的,并且能做到那些審視該問(wèn)題的人類專家所忽略的事情。
王: 您曾寫道,當(dāng)人類數(shù)學(xué)家面對(duì)一個(gè)新問(wèn)題時(shí),無(wú)論成功與否,他們都會(huì)產(chǎn)生見(jiàn)解供該領(lǐng)域的其他人構(gòu)建基礎(chǔ)——這是基于人工智能的證明所無(wú)法提供的。為什么會(huì)這樣?
陶哲軒: 這些問(wèn)題就像是你需要徒步前往的遙遠(yuǎn)地點(diǎn)。在過(guò)去,你必須踏上一段旅程。你可以放下路標(biāo)供他人跟隨,也可以繪制地圖。
人工智能工具就像是用直升機(jī)把你直接空降到目的地。你錯(cuò)過(guò)了旅程本身的所有益處。你直接到達(dá)了終點(diǎn),而這實(shí)際上只是解決這些問(wèn)題價(jià)值的一部分。
王: 當(dāng)您思考當(dāng)今這些模型的能力時(shí),除了讓非數(shù)學(xué)家能夠處理更高級(jí)的問(wèn)題外,它們還能為您的領(lǐng)域做出什么貢獻(xiàn)?
陶哲軒: 如今有很多非常乏味的數(shù)學(xué)工作是我們不喜歡做的,所以我們尋找巧妙的方法來(lái)繞過(guò)它們。但人工智能會(huì)很樂(lè)意猛沖通過(guò)這些繁瑣的計(jì)算。當(dāng)我們把人工智能整合到人類的工作流程中時(shí),我們就可以滑過(guò)這些障礙。
我還認(rèn)為數(shù)學(xué)家將開(kāi)始在更大的規(guī)模上進(jìn)行數(shù)學(xué)研究。想想科學(xué)研究中個(gè)案研究與人口調(diào)查之間的區(qū)別。如果你要在18世紀(jì)研究一種疾病,如果這是一種罕見(jiàn)病,你可能會(huì)研究一位患有此病的病人,記錄其所有癥狀并做詳盡的筆記。但在21世紀(jì),你可以進(jìn)行臨床試驗(yàn),給1000人用藥,進(jìn)行統(tǒng)計(jì)分析,從而獲得關(guān)于藥物效率更精確的信息。
數(shù)學(xué)仍然很大程度上處于個(gè)案研究的水平。一篇論文會(huì)選取一兩個(gè)問(wèn)題,以一種非常手工打造、高強(qiáng)度的方式對(duì)其進(jìn)行透徹研究。這是我們的風(fēng)格。但人工智能工具實(shí)現(xiàn)的是“群體研究”。
王: 您對(duì)人工智能模型在數(shù)學(xué)能力方面取得的進(jìn)步感到驚訝嗎?
陶哲軒: 有一點(diǎn)驚訝。發(fā)生的很多事情是我預(yù)料到的,但它們比我預(yù)期的時(shí)間表稍微提前了一點(diǎn)。并沒(méi)有提前太多。
例如,在2023年,我為微軟寫了一篇文章,預(yù)測(cè)到2026年,人工智能將成為值得信賴的合著者——即其對(duì)技術(shù)論文的貢獻(xiàn)將達(dá)到合著者的水平。那篇文章反響不一:有人說(shuō)我太過(guò)雄心勃勃,也有人說(shuō)我太過(guò)悲觀。但我認(rèn)為這基本上幾乎完全符合時(shí)間表。我們基本上看到人工智能的使用水平達(dá)到了我預(yù)期初級(jí)人類合著者所能做出的貢獻(xiàn),尤其是那些非常樂(lè)意做苦差事并解決大量繁瑣案例的合著者。
王: 在未來(lái)一兩年內(nèi),您希望或期待生成式人工智能模型有哪些改進(jìn)?
陶哲軒: 我們需要找到一個(gè)中間地帶,既鼓勵(lì)負(fù)責(zé)任地使用人工智能,又阻止不負(fù)責(zé)任的使用。這是一條需要小心行走的界線。但我們以前做到過(guò)。數(shù)學(xué)家經(jīng)常使用計(jì)算機(jī)進(jìn)行數(shù)值工作,當(dāng)計(jì)算機(jī)輔助證明首次出現(xiàn)時(shí),最初遭到了很多反對(duì),因?yàn)槿藗冑|(zhì)疑如何信任計(jì)算機(jī)代碼?但我們?cè)?0或30年里解決了這個(gè)問(wèn)題。不幸的是,現(xiàn)在的時(shí)間表被大大壓縮了。所以我們必須在幾年內(nèi)制定出我們的標(biāo)準(zhǔn)。而我們的社區(qū)通常不會(huì)移動(dòng)得那么快。
有一件非常基本的事情可以幫助數(shù)學(xué)社區(qū):當(dāng)人工智能給你一個(gè)問(wèn)題的答案時(shí),通常它不會(huì)很好地表明它對(duì)這個(gè)答案有多大的把握,或者它總是會(huì)說(shuō):“我完全確定這是真的。”人類也會(huì)這樣做。無(wú)論他們對(duì)某事是否有信心,這都是非常重要的信息。暫時(shí)提出一些你不確定的事情是可以的,但重要的是要標(biāo)記出你對(duì)此不確定。然而,人工智能工具并不能準(zhǔn)確地評(píng)估它們自己的置信度。這降低了它們的有用性。我們會(huì)更欣賞誠(chéng)實(shí)的人工智能。
此外,許多人工智能公司癡迷于“一鍵式”、完全自主的工作流程:你把任務(wù)交給人工智能,然后你去喝杯咖啡,回來(lái)時(shí)問(wèn)題就解決了。這實(shí)際上并不理想。對(duì)于困難的問(wèn)題,你真正想要的是人類與人工智能之間的對(duì)話。而人工智能公司并沒(méi)有真正促進(jìn)這種互動(dòng)。
如果我們能與至少一些愿意開(kāi)發(fā)更多互動(dòng)平臺(tái)的技術(shù)公司合作,那將會(huì)更容易被人們所接受。我們不想淪為只是按按鈕的角色。
說(shuō)明:本號(hào)刊發(fā)來(lái)自各方的文章,是為了獲得更全面的信息,不代表本號(hào)支持文章中的觀點(diǎn)。由于微信公眾號(hào)每天只能推送一次,本站目前在騰訊新聞發(fā)布最新的文章,每天24小時(shí)不間斷更新,請(qǐng)?jiān)隍v訊新聞中搜索“邸鈔”,或在瀏覽器中點(diǎn)擊:
https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.