昨天,陶哲軒在他的個人博客上發(fā)布了一則論文更新。他在貼文中寫道,“我很少寫哲學(xué)性質(zhì)的長篇文章,上一次大概是 2007 年。”這位菲爾茲獎得主、加州大學(xué)洛杉磯分校數(shù)學(xué)教授,剛在 arXiv 上傳了一篇題為《人工智能時代的數(shù)學(xué)方法與人類思維》(Mathematical Methods And Human Thoughts In The Age Of AI) 的論文,論文的合著者是他的多年好友、跨學(xué)科學(xué)者 Tanya Klowden。
陶哲軒還補(bǔ)充道,這篇論文的撰寫耗時超過一年,或許這聽起來和當(dāng)今人工智能的發(fā)展速度相比有些滯后。但他們想跳出當(dāng)下人工智能與形式化工具帶來的具體技術(shù)問題,而是想把視角聚焦在 AI 與人類智能關(guān)系的深度思考:他們的話題非常的廣泛,從古希臘的歐幾里得講到當(dāng)下的大語言模型,從數(shù)學(xué)證明的“氣味”談到十九世紀(jì)盧德分子砸毀紡織機(jī)的往事。論文將作為即將出版的《布萊克威爾數(shù)學(xué)哲學(xué)指南》中的一個章節(jié)。
![]()
(來源:陶哲軒個人博客)
過去兩年,陶哲軒對 AI 工具的態(tài)度經(jīng)歷了一次公開的轉(zhuǎn)變。在2024 年,他曾把使用 AI 做數(shù)學(xué)比作“指導(dǎo)一個平庸但還算有點(diǎn)能力的研究生”。而到了 2026 年 2 月初,在 UCLA 舉辦的一場名為“用 AI 加速數(shù)學(xué)與理論物理”的會議上,他的措辭變成了“AI 現(xiàn)在可以正式上場了”,因?yàn)樗肮?jié)省的時間已經(jīng)超過了它浪費(fèi)的時間”。
但陶哲軒并沒有因此變成技術(shù)樂觀主義的布道者。他依然站在“人”的這一側(cè)。這篇新論文試圖回答的問題是:當(dāng) AI 可以生成外表光鮮、邏輯上無可挑剔的數(shù)學(xué)證明時,我們還需要人類數(shù)學(xué)家做什么?更廣泛地說,當(dāng) AI 開始自動化創(chuàng)造過程本身,不只是通訊、計算、排版這些輔助環(huán)節(jié),我們該如何重新定義智識工作的價值?
論文的核心論點(diǎn)可以概括為一句話:AI 是人類工具演進(jìn)的自然延續(xù),但它的發(fā)展必須以人為中心。這聽起來像是一句正確但空洞的口號,但陶哲軒和 Klowden 花了相當(dāng)篇幅來解釋他們所說的“以人為中心”具體意味著什么。
首先是關(guān)于數(shù)學(xué)證明的“氣味”問題。這里的“氣味”可以理解成一種直覺性的體驗(yàn),任何一個有經(jīng)驗(yàn)的數(shù)學(xué)家在閱讀一篇論文時,往往在逐行檢查之前就已經(jīng)對論證的可信度有了直覺判斷。這種直覺來自于證明是否提供了“理解”,不只是顯示假設(shè)蘊(yùn)含結(jié)論,還能解釋為什么這種蘊(yùn)含是可能的,哪些步驟是關(guān)鍵的,哪些是常規(guī)的。論文引用了著名數(shù)學(xué)家瑟斯頓(William Thurston)的觀點(diǎn):好的證明不僅正確,還要提供洞見。
問題在于,當(dāng)前的形式化驗(yàn)證系統(tǒng)(如 Lean 或 Rocq)只能檢查證明的邏輯正確性,無法捕捉這種“氣味”。一個 AI 可能產(chǎn)出“無味”的證明,在技術(shù)上完美無瑕,卻讓讀者感到莫名不滿,因?yàn)樗鼪]有告訴你任何關(guān)于更廣泛數(shù)學(xué)領(lǐng)域的信息。
2024 年國際數(shù)學(xué)奧林匹克(International Mathematical Olympiad,簡稱 IMO)上,DeepMind 的 AlphaProof 系統(tǒng)解出了包括最難的第六題在內(nèi)的三道題目,獲得銀牌水平的成績。但陶哲軒在論文中指出,那些 AI 生成的證明“包含大量冗余或難以解釋的步驟”,盡管它們都通過了 Lean 的形式化驗(yàn)證。
這就引出了論文的第二個關(guān)鍵論點(diǎn):形式化驗(yàn)證是必要的,但遠(yuǎn)遠(yuǎn)不夠,翻譯錯誤的風(fēng)險始終存在。費(fèi)馬大定理陳述中隱含的假設(shè)是自然數(shù)從 1 開始而非從 0 開始,一個不加注意的 AI 可能因此“證明”費(fèi)馬大定理是錯的。更微妙的是,即使在純粹抽象的數(shù)學(xué)領(lǐng)域,只有一部分論證可以被形式化;圍繞這個核心的是一圈啟發(fā)式、經(jīng)驗(yàn)性、元數(shù)學(xué)的推理,這些推理提供了關(guān)于論證為何有效、是否可推廣、動機(jī)何在的寶貴信息。
這些問題在數(shù)學(xué)領(lǐng)域已經(jīng)足夠復(fù)雜,推廣到現(xiàn)實(shí)世界就更加棘手了。論文用了相當(dāng)篇幅討論 AI 的社會成本:數(shù)據(jù)中心的能源和水資源消耗、入門級工作崗位的消失、訓(xùn)練數(shù)據(jù)的知識產(chǎn)權(quán)爭議、以及“數(shù)字鴻溝”。不僅是有 AI 和沒有 AI 的人群之間的差距,還包括被鎖定在不同 AI 生態(tài)系統(tǒng)中的研究者之間能力的不均衡。
Tanya Klowden 的加入則讓論文有了更加廣泛的關(guān)切。
![]()
圖 | 陶哲軒與 Tanya 合照(來源:Instagram)
她的背景頗為豐富精彩:首先是物理學(xué)碩士(研究課題是石墨烯的催化刻蝕)、藝術(shù)史碩士(研究 16 世紀(jì)西班牙宮廷肖像畫中的合作關(guān)系),曾是舞臺設(shè)計師,現(xiàn)在是倫敦考陶爾德藝術(shù)學(xué)院的博士研究生。陶哲軒在博客中稱她為“博學(xué)者”(polymath),兩人還合作撰寫了一本關(guān)于天文學(xué)距離階梯的科普書籍,即將由耶魯大學(xué)出版社出版。這種跨學(xué)科的組合使得論文能夠在技術(shù)細(xì)節(jié)和人文關(guān)懷之間自如切換:從 Lean 證明助手的語法講到十九世紀(jì)諾丁漢紡織工人的絕望反抗。
論文中有一個引人注目的類比,現(xiàn)代 AI 的出現(xiàn)類似于天文學(xué)中的哥白尼革命,這在陶哲軒在近日接受 Dwarkesh Podcast 采訪也有所提及。在古代地心說模型中,地球享有宇宙中心的特殊本體論地位;歷經(jīng)幾個世紀(jì)的天文學(xué)和物理學(xué)進(jìn)步,這種特權(quán)被逐步瓦解,取而代之的是哥白尼原理。地球只是無數(shù)行星中的一顆,不受自然法則的任何特殊對待。類似地,人類智能長期以來被視為認(rèn)知宇宙的中心,但現(xiàn)在我們正在發(fā)現(xiàn)(或創(chuàng)造)其他與我們在很多方面可比但又截然不同的“智能行星”。
![]()
(來源:Youtube)
這個類比的微妙之處在于:接受地球在宇宙中的平凡地位,并不妨礙我們繼續(xù)高度關(guān)心地球上發(fā)生的事情。同樣,承認(rèn)人類智能不再是唯一的智能形式,也不意味著我們要放棄對人類認(rèn)知活動的重視。論文引用了國際象棋的例子:自從 1990 年代人類棋手再也無法戰(zhàn)勝象棋引擎之后,國際象棋非但沒有消亡,反而作為一項人類活動繼續(xù)繁榮。棋手們把引擎整合進(jìn)訓(xùn)練中,用它來重新審視舊理論、探索新戰(zhàn)術(shù)、尋找即使是“不可戰(zhàn)勝”的 AI 也可能存在的弱點(diǎn)。
但論文也承認(rèn),這種樂觀的共存場景有賴于一些條件,而這些條件目前遠(yuǎn)未得到滿足。作者們明確拒絕了三種極端立場:純粹形式主義(只要符號操作正確就行,不需要理解),人類沙文主義(人類創(chuàng)造力有某種不可言喻的特質(zhì)是 AI 永遠(yuǎn)無法復(fù)制的),以及 AI 至上主義(人類認(rèn)知活動是一種苦差事,應(yīng)該盡快被自動化取代)。他們認(rèn)為,在這些極端之間存在哲學(xué)上的中間地帶,可以為人與 AI 之間的互補(bǔ)共存提供有用的視角。
具體到當(dāng)下的實(shí)踐建議,論文提出了一個逐步演進(jìn)的框架。短期內(nèi),AI 應(yīng)該像烘焙中的香草精,適量添加可以提升風(fēng)味,過量則會毀掉整道菜。中期內(nèi),AI 適合扮演“紅隊”角色,負(fù)責(zé)測試、驗(yàn)證、檢查人類生成的內(nèi)容,但不應(yīng)該在“藍(lán)隊”,即核心創(chuàng)作環(huán)節(jié)和承擔(dān)結(jié)構(gòu)性職責(zé)。至于長期,論文只是提出了問題而沒有給出答案:如果未來某一天,AI 在所有實(shí)際維度上都超越了人類專家,我們將如何應(yīng)對那些關(guān)于智識勞動價值的根本性哲學(xué)問題?
陶哲軒在 Dwarkesh 那里接受采訪時曾說,他在 2023 年預(yù)測“到 2026 年 AI 將成為數(shù)學(xué)研究中值得信賴的合著者”,現(xiàn)在他對這個預(yù)測感到滿意。但他也坦言,AI 讓他的論文更豐富了,核心突破仍然要靠紙筆完成。AI 擅長廣度,人類擅長深度,二者高度互補(bǔ);他認(rèn)為人機(jī)混合將在數(shù)學(xué)領(lǐng)域占據(jù)主導(dǎo)地位的時間會比很多人預(yù)期的更長。
論文的最后一部分坦率地討論了知識產(chǎn)權(quán)和責(zé)任歸屬的困境。當(dāng) AI 被應(yīng)用于一個問題時,誰對錯誤負(fù)責(zé)?誰獲得洞見的榮譽(yù)?這兩者可能并不是同一方,甚至可能根本沒有明確定義的“方”。傳統(tǒng)的學(xué)術(shù)引用系統(tǒng)是否足以處理一個可能有數(shù)百或數(shù)千個“隱藏”貢獻(xiàn)者的場景?僅僅引用 AI 模型本身是否足夠?論文沒有給出答案,但它指出,隱藏 AI 使用的做法已經(jīng)在學(xué)術(shù)界引發(fā)了類似于抄襲的強(qiáng)烈反應(yīng),這反過來又導(dǎo)致一些從工具中受益的研究者更加隱蔽地使用它們。
在采訪和博客中,陶哲軒反復(fù)強(qiáng)調(diào)一個觀點(diǎn):AI 的能力不是一個單一的量。同一個任務(wù),根據(jù)你給它多少資源、多少輔助、如何報告結(jié)果,AI 的表現(xiàn)可以相差幾個數(shù)量級。用他在 Mastodon 上的帖子來說,這就像評估一個人類學(xué)生的能力。是讓他在考場上閉卷作答四小時,還是讓他和導(dǎo)師、同學(xué)討論幾天再提交論文?兩種場景測試的是完全不同的東西。
這篇論文或許不會改變?nèi)魏握谶M(jìn)行中的 AI 開發(fā)路線圖,但它代表了一種聲音:來自一個在 AI 應(yīng)用于數(shù)學(xué)方面走在最前沿的實(shí)踐者,卻也愿意停下來問一些不那么容易回答的問題。
在結(jié)尾,陶哲軒和 Tanya 在腳注中寫道:“一個著名的 Tumblr 思想實(shí)驗(yàn)得出結(jié)論,一塊香草精含量達(dá)到 44% 的蛋糕是無法食用的。”盡管我們總是幻想著它更多一點(diǎn)更美味。這就好像目前的 AI 使用,適量添加可以增強(qiáng)和豐富作品,但如果 AI 內(nèi)容成為核心組成部分,將不會產(chǎn)生理想、有效或有價值的結(jié)果。
當(dāng)前 AI 的使用量或許大概還遠(yuǎn)沒到 44%,但在某些領(lǐng)域,例如學(xué)生作業(yè)、低質(zhì)量論文、社交媒體內(nèi)容……這個比例正在快速攀升。因此,論文的立場是,精靈已經(jīng)出了瓶子,試圖把它塞回去既不現(xiàn)實(shí)也可能弊大于利;現(xiàn)在的問題是如何與它共處,同時確保人類的需求、人類的創(chuàng)造力、人類的理解始終處于等式的核心。
1.https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/
2.https://arxiv.org/abs/2603.26524
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.