![]()
很多人都有過這樣的體驗:面對一道復雜的數學題,反復推演、草稿紙寫滿,卻始終找不到關鍵一步。
那種卡在思路邊緣卻無法突破的感覺,幾乎是所有學習過數學的人共同的記憶。
長期以來,人們也因此相信,數學是最接近人類純粹理性的領域之一——它不僅需要計算,更需要直覺、創造力和漫長的思考。
但現在,這種認知正在被迅速動搖。
在今年的圓周率日(3月14日)到來之際,《新科學家)(
New Scientist)梳理了數學正在經歷的史上最大變革。
短短幾年之間,人工智能已經從連高中題都難以穩定解決,發展到能夠參與真實數學研究、提出證明思路,甚至自動驗證菲爾茲獎級別的成果。
當機器開始觸及數學最核心的能力——證明與創造——一個問題正在浮現:未來的數學家,究竟還需要做什么?
也許,這正是數學史上最劇烈的一次轉折。而我們可能正處在它剛剛開始的時刻。
本文16小節,4200多字:
一場可能輸掉的賭注
從“解不出高中題”到研究級問題
數學界意識到:變革已經到來
國際數學奧賽:AI的關鍵里程碑
AI開始參與真正的數學研究
“第一證明”:給AI設立真實測試
證明能力的躍升
AI如何“做數學”
“證明成立了嗎?”新的哲學問題
自動化證明驗證:形式化數學的突破
人類與人工智能的協作
20萬行代碼的數學證明
數學研究方式或將徹底改變
數學家的擔憂
數學家的新角色
一種新的數學時代
![]()
2026年3月10日發表于《新科學家)(New Scientist)的關于“數學正經歷史上最大變革”的文章截圖。
長期以來,數學被視為最難被人工智能攻克的智力領域之一。它不僅需要邏輯推理,還依賴高度抽象的概念構建與嚴密證明。許多數學家曾認為,這種能力屬于人類獨有的思維疆域。
但在過去短短幾年間,這種判斷正在迅速動搖。人工智能在數學領域的進展速度,遠遠超出了許多數學家的預期。一些研究者甚至認為,這一變化可能正在重新定義“數學家”這一職業本身。
1.
一場可能輸掉的賭注
2025年3月,多倫多大學的數學家丹尼爾·利特(Daniel Litt)與同事打了一個賭。
當時,盡管人工智能在多個領域取得突破,但他仍然認為數學相對安全。他估計:到2030年,人工智能寫出達到頂級數學家水平的數學論文的概率只有25%。
然而僅僅一年后,他的判斷就發生了改變。
利特在自己的博客中坦言:
“我現在預計會輸掉這個賭。”
這一轉變并非個例。越來越多數學家意識到,人工智能在數學推理能力上的進步速度,已經遠遠超出此前的預期。
2.
從“解不出高中題”到研究級問題
就在幾年前,人工智能在數學問題上的表現仍然相當有限。
利特回憶說,當時的系統甚至難以穩定解決高中數學題。但如今,情況已經完全不同。
他說:
“現在它們有時已經能夠解決真正出現在數學研究中的問題。”
換句話說,人工智能正在跨越一個關鍵門檻:
從課堂練習走向真正的數學研究。
這種躍遷讓許多數學家感到震驚。
![]()
手寫數學的時代即將結束嗎?
3.
數學界意識到:變革已經到來
隨著人工智能能力的不斷提升,一些學者開始公開討論數學職業可能發生的深刻變化。
美國卡內基梅隆大學的數學家杰里米·阿維加德(Jeremy Avigad)在一篇文章中直言:
“我們正在失去可以躲藏的地方。”
他認為,數學界必須面對一個越來越明顯的現實:
人工智能很快可能在定理證明方面超過人類。
值得注意的是,這種反應并非由某一個突破性事件引發,而是來自持續不斷的技術進步。
4.
國際數學奧賽:AI的關鍵里程碑
過去一年,一系列事件加速了數學界的這種認知變化。
例如,OpenAI和谷歌DeepMind開發的人工智能系統,在國際數學奧林匹克競賽中取得了金牌級成績。
這一結果震動了整個領域。此前,許多專家都認為,這項世界頂級高中數學競賽所涉及的復雜推理,遠遠超出人工智能工具的能力范圍。
但現實證明,這一判斷可能已經過時。
5.
AI開始參與真正的數學研究
進入2026年,這一趨勢進一步升級。
今年1月,數學家開始利用類似的人工智能工具,解決匈牙利傳奇數學家保羅·埃爾德什(Paul Erd?s)提出的一些長期未解問題。
與此同時,人工智能正在進入更復雜的數學工作流程:
幫助解決真實的研究級數學問題
自動化驗證最前沿的數學證明
在傳統數學研究中,驗證一個復雜證明往往需要多個研究團隊投入大量時間。而現在,人工智能正被用于加速這一過程。
6.
“第一證明”:給AI設立真實測試
為了更系統地評估人工智能的數學能力,美國加州大學伯克利分校的數學家尼基爾·斯里瓦斯塔瓦(Nikhil Srivastava)在2026年2月發起了一個名為“第一證明”的項目。
這個項目的目標是建立一種更接近真實研究環境的評測基準。
項目的第一輪測試包含10道數學問題,這些問題并不是人為設計的競賽題,而是研究者在工作中真實遇到的問題,來自多個不同數學領域。
斯里瓦斯塔瓦解釋說:
這些問題代表的是數學研究中“自然出現的問題”。
它們的難度分布也具有代表性:
不是極端困難的難題
但也絕非日常例行計算
他說:
“這些問題的難度范圍很廣,基本反映了研究工作中的真實情況。”
7.
證明能力的躍升
“第一證明”項目公布題目后,很快就吸引了大量研究者參與。來自科技公司的團隊也加入了測試,其中包括OpenAI和谷歌DeepMind。
根據各自提供的數據:
OpenAI表示,在專家反饋評估下,其人工智能模型正確解決了10道題中的5道。
谷歌DeepMind的模型則被評為解決了6道題。
谷歌DeepMind的研究人員梁湯(Thang Luong,音)表示,人工智能能力的變化速度令人驚訝:
“事情變化得非常快。現在,對我們來說,人工智能已經成為真正嚴肅的合作伙伴——既可以參與嚴肅研究,在‘第一證明’這樣的任務中,它甚至能夠自己提出解決方案。”
8.
AI如何“做數學”
谷歌開發的數學人工智能工具名為Aletheia。該系統結合了兩種關鍵技術:
基于“Gemini”的高計算量版本人工智能模型
用于檢測推理漏洞的自動驗證算法
其工作方式類似一種循環迭代流程:
人工智能生成一個潛在解答
驗證算法檢查其中的邏輯漏洞
系統自動修正并生成新的版本
重復這一過程,直到得到穩定結果
不過,谷歌并未公開Aletheia在解決這些問題時進行了多少次迭代,因此外界仍難以精確評估其真實能力。
盡管如此,數學界普遍認為,這一結果已經相當令人印象深刻。
9.
“證明成立了嗎?”新的哲學問題
值得注意的是,并非所有問題的解答都獲得一致認可。
例如第8題——一個涉及較為冷門幾何領域的問題——谷歌咨詢的7位專家中,只有5位認為人工智能給出的解答是正確的。
英國劍橋大學的數學家伊萬·史密斯(Ivan Smith)并未參與谷歌團隊,但他認為人工智能的思路總體上是合理的。
他說,如果這樣的解答來自一名博士生,導師通常會感到鼓舞:
“如果這是一個博士生帶著自己的想法回來討論,這會讓人覺得很有希望,并逐漸建立起對結果正確性的信心。”
這一情況揭示了人工智能數學的一個核心難題:
驗證人工智能生成的證明,本身就是一項艱巨工作。
理論上甚至可能出現一種局面:
人工智能生成證明的速度,超過人類檢查證明的速度。
于是,一個新的哲學問題隨之出現:
如果人工智能證明了一個定理,但沒有人能夠檢查它——這個定理算被證明了嗎?
10.
自動化證明驗證:形式化數學的突破
在這一問題上,人工智能也開始提供解決方案。
近年來,一項關鍵技術正在迅速發展:數學證明的形式化。
所謂“形式化”,指的是把數學家用自然語言寫出的證明,轉化為計算機可以逐行檢查的邏輯代碼。
最近,人工智能公司數學公司(Math, Inc.)的一項成果震動了數學界。
該公司宣布,其人工智能工具Gauss已經完成了一項重要工作:
自動形式化并驗證了一項獲得菲爾茲獎的數學證明。
這項證明來自烏克蘭數學家瑪麗娜·維亞佐夫斯卡(Maryna Viazovska)。她在2022年獲得菲爾茲獎,這項獎項常被稱為“數學界的諾貝爾獎”。
她的研究解決了一個經典問題:
在特定維度空間中,球體如何以最密集方式排列。
11.
人類與人工智能的協作
事實上,這項形式化工作并非完全由人工智能獨立完成。
早在2024年底,一個由數學家組成的小型研究團隊就已經開始嘗試手動完成這一任務。該團隊由卡內基梅隆大學的西達爾特·哈里哈蘭(Sidharth Hariharan)領導。
研究人員最初計劃:
把維亞佐夫斯卡提出的8維球體堆積證明逐步翻譯成計算機代碼。
項目進展穩定,但在此過程中,數學公司后來提供了技術支持,并宣布其人工智能系統已經完成:
完整的8維證明形式化
以及24維情形的更一般結果
參與項目的倫敦帝國學院數學家巴維克·梅塔(Bhavik Mehta)指出,人類研究者此前完成了關鍵準備工作:
他們已經:
制定了形式化方案
定義了必要的數學概念
如果沒有這些基礎,人工智能無法完成最終證明。
英國東英吉利大學的研究者克里斯·伯克貝克(Chris Birkbeck)形象地描述這一過程:
“我們已經把所有零件都做出來了,但還沒有寫出如何把它們組裝起來的說明書。”
12.
20萬行代碼的數學證明
最終生成的形式化證明規模驚人:
整整約20萬行代碼。
這一體量意味著:
它占到了目前所有已形式化數學內容的約10%。
荷蘭烏得勒支大學的數學家約翰·科梅林(Johan Commelin)認為,這是一項具有里程碑意義的成就。
盡管這段代碼的長度可能是人類手寫版本的約10倍,但他仍然評價說:
“這是一件大事。這是菲爾茲獎級別的數學工作,而它正在被自動形式化。”
13.
數學研究方式或將徹底改變
科梅林認為,這種技術未來可能擴展到更多數學領域,從而改變整個學科的運作方式。
他設想的未來是:
新的數學論文可以被工具自動形式化,并自動檢測其中是否存在錯誤。
如果這一愿景實現,將對學術體系產生巨大影響,例如:
同行評審
論文審稿
數學證明驗證
這些流程都可能被徹底重塑。
14.
數學家的擔憂
然而,這一趨勢也引發了一些擔憂。
阿維加德等數學家警告,如果越來越多的數學研究由機器完成,可能會削弱人類自身創造數學的能力。
美國范德堡大學的數學家安娜·瑪麗·博曼(Anna Marie Bohmann)指出,依賴機器解決問題會帶來一種損失:
學習機會的消失。
她認為,數學學習和研究的重要過程恰恰在于:
困惑
試錯
構思新想法
推導解決方案
這些過程正是學生和研究者深化理解的關鍵。
15.
數學家的新角色
谷歌DeepMind團隊成員馮東尼(Tony Feng,音)也表達了類似的謹慎態度。
他坦言,在使用人工智能工具時,有時會產生一種心理:
“我應該自己完成作業,親自經歷建立直覺的過程。”
即便是在形式化證明方面,研究者仍然需要理解人工智能生成的內容。
梅塔和同事們接下來的一項重要任務,就是逐行分析那20萬行人工智能生成的代碼,找出其中哪些方法可以應用到未來研究中。
16.
一種新的數學時代
盡管存在擔憂,許多數學家依然對未來保持樂觀。
科梅林指出,在歷史上,數學家的工作方式已經經歷過多次變化。
例如,在過去:
大量手工計算曾是數學研究的重要組成部分。
但今天,這些計算幾乎完全由計算機自動完成。
他認為,類似的轉變可能正在發生:
數學家的工作內容會發生巨大變化,但數學本身不會消失。
科梅林總結說:
“也許10年或20年之后,我們仍然會認出自己正在做的事情是數學,只不過是一種全新的數學風格。”
參考資料:
"Mathematics is undergoing the biggest change in its history" by Alex Wilkins from New Scientist, Published 10 March 2026
本文配圖來源:量子號
你可能還想知道:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.