陶哲軒最新論文：拒絕技術(shù)至上，AI 需要以人為本被重新定義

2026-03-31 18:49:26　來源: DeepTech深科技

北京舉報

分享至

昨天，陶哲軒在他的個人博客上發(fā)布了一則論文更新。他在貼文中寫道，“我很少寫哲學(xué)性質(zhì)的長篇文章，上一次大概是 2007 年。”這位菲爾茲獎得主、加州大學(xué)洛杉磯分校數(shù)學(xué)教授，剛在 arXiv 上傳了一篇題為《人工智能時代的數(shù)學(xué)方法與人類思維》(Mathematical Methods And Human Thoughts In The Age Of AI) 的論文，論文的合著者是他的多年好友、跨學(xué)科學(xué)者 Tanya Klowden。

陶哲軒還補(bǔ)充道，這篇論文的撰寫耗時超過一年，或許這聽起來和當(dāng)今人工智能的發(fā)展速度相比有些滯后。但他們想跳出當(dāng)下人工智能與形式化工具帶來的具體技術(shù)問題，而是想把視角聚焦在 AI 與人類智能關(guān)系的深度思考：他們的話題非常的廣泛，從古希臘的歐幾里得講到當(dāng)下的大語言模型，從數(shù)學(xué)證明的“氣味”談到十九世紀(jì)盧德分子砸毀紡織機(jī)的往事。論文將作為即將出版的《布萊克威爾數(shù)學(xué)哲學(xué)指南》中的一個章節(jié)。

（來源：陶哲軒個人博客）

過去兩年，陶哲軒對 AI 工具的態(tài)度經(jīng)歷了一次公開的轉(zhuǎn)變。在2024 年，他曾把使用 AI 做數(shù)學(xué)比作“指導(dǎo)一個平庸但還算有點(diǎn)能力的研究生”。而到了 2026 年 2 月初，在 UCLA 舉辦的一場名為“用 AI 加速數(shù)學(xué)與理論物理”的會議上，他的措辭變成了“AI 現(xiàn)在可以正式上場了”，因?yàn)樗肮?jié)省的時間已經(jīng)超過了它浪費(fèi)的時間”。

但陶哲軒并沒有因此變成技術(shù)樂觀主義的布道者。他依然站在“人”的這一側(cè)。這篇新論文試圖回答的問題是：當(dāng) AI 可以生成外表光鮮、邏輯上無可挑剔的數(shù)學(xué)證明時，我們還需要人類數(shù)學(xué)家做什么？更廣泛地說，當(dāng) AI 開始自動化創(chuàng)造過程本身，不只是通訊、計算、排版這些輔助環(huán)節(jié)，我們該如何重新定義智識工作的價值？

論文的核心論點(diǎn)可以概括為一句話：AI 是人類工具演進(jìn)的自然延續(xù)，但它的發(fā)展必須以人為中心。這聽起來像是一句正確但空洞的口號，但陶哲軒和 Klowden 花了相當(dāng)篇幅來解釋他們所說的“以人為中心”具體意味著什么。

首先是關(guān)于數(shù)學(xué)證明的“氣味”問題。這里的“氣味”可以理解成一種直覺性的體驗(yàn)，任何一個有經(jīng)驗(yàn)的數(shù)學(xué)家在閱讀一篇論文時，往往在逐行檢查之前就已經(jīng)對論證的可信度有了直覺判斷。這種直覺來自于證明是否提供了“理解”，不只是顯示假設(shè)蘊(yùn)含結(jié)論，還能解釋為什么這種蘊(yùn)含是可能的，哪些步驟是關(guān)鍵的，哪些是常規(guī)的。論文引用了著名數(shù)學(xué)家瑟斯頓（William Thurston）的觀點(diǎn)：好的證明不僅正確，還要提供洞見。

問題在于，當(dāng)前的形式化驗(yàn)證系統(tǒng)（如 Lean 或 Rocq）只能檢查證明的邏輯正確性，無法捕捉這種“氣味”。一個 AI 可能產(chǎn)出“無味”的證明，在技術(shù)上完美無瑕，卻讓讀者感到莫名不滿，因?yàn)樗鼪]有告訴你任何關(guān)于更廣泛數(shù)學(xué)領(lǐng)域的信息。

2024 年國際數(shù)學(xué)奧林匹克（International Mathematical Olympiad，簡稱 IMO）上，DeepMind 的 AlphaProof 系統(tǒng)解出了包括最難的第六題在內(nèi)的三道題目，獲得銀牌水平的成績。但陶哲軒在論文中指出，那些 AI 生成的證明“包含大量冗余或難以解釋的步驟”，盡管它們都通過了 Lean 的形式化驗(yàn)證。

這就引出了論文的第二個關(guān)鍵論點(diǎn)：形式化驗(yàn)證是必要的，但遠(yuǎn)遠(yuǎn)不夠，翻譯錯誤的風(fēng)險始終存在。費(fèi)馬大定理陳述中隱含的假設(shè)是自然數(shù)從 1 開始而非從 0 開始，一個不加注意的 AI 可能因此“證明”費(fèi)馬大定理是錯的。更微妙的是，即使在純粹抽象的數(shù)學(xué)領(lǐng)域，只有一部分論證可以被形式化；圍繞這個核心的是一圈啟發(fā)式、經(jīng)驗(yàn)性、元數(shù)學(xué)的推理，這些推理提供了關(guān)于論證為何有效、是否可推廣、動機(jī)何在的寶貴信息。

這些問題在數(shù)學(xué)領(lǐng)域已經(jīng)足夠復(fù)雜，推廣到現(xiàn)實(shí)世界就更加棘手了。論文用了相當(dāng)篇幅討論 AI 的社會成本：數(shù)據(jù)中心的能源和水資源消耗、入門級工作崗位的消失、訓(xùn)練數(shù)據(jù)的知識產(chǎn)權(quán)爭議、以及“數(shù)字鴻溝”。不僅是有 AI 和沒有 AI 的人群之間的差距，還包括被鎖定在不同 AI 生態(tài)系統(tǒng)中的研究者之間能力的不均衡。

Tanya Klowden 的加入則讓論文有了更加廣泛的關(guān)切。

圖 | 陶哲軒與 Tanya 合照（來源：Instagram）

她的背景頗為豐富精彩：首先是物理學(xué)碩士（研究課題是石墨烯的催化刻蝕）、藝術(shù)史碩士（研究 16 世紀(jì)西班牙宮廷肖像畫中的合作關(guān)系），曾是舞臺設(shè)計師，現(xiàn)在是倫敦考陶爾德藝術(shù)學(xué)院的博士研究生。陶哲軒在博客中稱她為“博學(xué)者”（polymath），兩人還合作撰寫了一本關(guān)于天文學(xué)距離階梯的科普書籍，即將由耶魯大學(xué)出版社出版。這種跨學(xué)科的組合使得論文能夠在技術(shù)細(xì)節(jié)和人文關(guān)懷之間自如切換：從 Lean 證明助手的語法講到十九世紀(jì)諾丁漢紡織工人的絕望反抗。

論文中有一個引人注目的類比，現(xiàn)代 AI 的出現(xiàn)類似于天文學(xué)中的哥白尼革命，這在陶哲軒在近日接受 Dwarkesh Podcast 采訪也有所提及。在古代地心說模型中，地球享有宇宙中心的特殊本體論地位；歷經(jīng)幾個世紀(jì)的天文學(xué)和物理學(xué)進(jìn)步，這種特權(quán)被逐步瓦解，取而代之的是哥白尼原理。地球只是無數(shù)行星中的一顆，不受自然法則的任何特殊對待。類似地，人類智能長期以來被視為認(rèn)知宇宙的中心，但現(xiàn)在我們正在發(fā)現(xiàn)（或創(chuàng)造）其他與我們在很多方面可比但又截然不同的“智能行星”。

（來源：Youtube）

這個類比的微妙之處在于：接受地球在宇宙中的平凡地位，并不妨礙我們繼續(xù)高度關(guān)心地球上發(fā)生的事情。同樣，承認(rèn)人類智能不再是唯一的智能形式，也不意味著我們要放棄對人類認(rèn)知活動的重視。論文引用了國際象棋的例子：自從 1990 年代人類棋手再也無法戰(zhàn)勝象棋引擎之后，國際象棋非但沒有消亡，反而作為一項人類活動繼續(xù)繁榮。棋手們把引擎整合進(jìn)訓(xùn)練中，用它來重新審視舊理論、探索新戰(zhàn)術(shù)、尋找即使是“不可戰(zhàn)勝”的 AI 也可能存在的弱點(diǎn)。

但論文也承認(rèn)，這種樂觀的共存場景有賴于一些條件，而這些條件目前遠(yuǎn)未得到滿足。作者們明確拒絕了三種極端立場：純粹形式主義（只要符號操作正確就行，不需要理解），人類沙文主義（人類創(chuàng)造力有某種不可言喻的特質(zhì)是 AI 永遠(yuǎn)無法復(fù)制的），以及 AI 至上主義（人類認(rèn)知活動是一種苦差事，應(yīng)該盡快被自動化取代）。他們認(rèn)為，在這些極端之間存在哲學(xué)上的中間地帶，可以為人與 AI 之間的互補(bǔ)共存提供有用的視角。

具體到當(dāng)下的實(shí)踐建議，論文提出了一個逐步演進(jìn)的框架。短期內(nèi)，AI 應(yīng)該像烘焙中的香草精，適量添加可以提升風(fēng)味，過量則會毀掉整道菜。中期內(nèi)，AI 適合扮演“紅隊”角色，負(fù)責(zé)測試、驗(yàn)證、檢查人類生成的內(nèi)容，但不應(yīng)該在“藍(lán)隊”，即核心創(chuàng)作環(huán)節(jié)和承擔(dān)結(jié)構(gòu)性職責(zé)。至于長期，論文只是提出了問題而沒有給出答案：如果未來某一天，AI 在所有實(shí)際維度上都超越了人類專家，我們將如何應(yīng)對那些關(guān)于智識勞動價值的根本性哲學(xué)問題？

陶哲軒在 Dwarkesh 那里接受采訪時曾說，他在 2023 年預(yù)測“到 2026 年 AI 將成為數(shù)學(xué)研究中值得信賴的合著者”，現(xiàn)在他對這個預(yù)測感到滿意。但他也坦言，AI 讓他的論文更豐富了，核心突破仍然要靠紙筆完成。AI 擅長廣度，人類擅長深度，二者高度互補(bǔ)；他認(rèn)為人機(jī)混合將在數(shù)學(xué)領(lǐng)域占據(jù)主導(dǎo)地位的時間會比很多人預(yù)期的更長。

論文的最后一部分坦率地討論了知識產(chǎn)權(quán)和責(zé)任歸屬的困境。當(dāng) AI 被應(yīng)用于一個問題時，誰對錯誤負(fù)責(zé)？誰獲得洞見的榮譽(yù)？這兩者可能并不是同一方，甚至可能根本沒有明確定義的“方”。傳統(tǒng)的學(xué)術(shù)引用系統(tǒng)是否足以處理一個可能有數(shù)百或數(shù)千個“隱藏”貢獻(xiàn)者的場景？僅僅引用 AI 模型本身是否足夠？論文沒有給出答案，但它指出，隱藏 AI 使用的做法已經(jīng)在學(xué)術(shù)界引發(fā)了類似于抄襲的強(qiáng)烈反應(yīng)，這反過來又導(dǎo)致一些從工具中受益的研究者更加隱蔽地使用它們。

在采訪和博客中，陶哲軒反復(fù)強(qiáng)調(diào)一個觀點(diǎn)：AI 的能力不是一個單一的量。同一個任務(wù)，根據(jù)你給它多少資源、多少輔助、如何報告結(jié)果，AI 的表現(xiàn)可以相差幾個數(shù)量級。用他在 Mastodon 上的帖子來說，這就像評估一個人類學(xué)生的能力。是讓他在考場上閉卷作答四小時，還是讓他和導(dǎo)師、同學(xué)討論幾天再提交論文？兩種場景測試的是完全不同的東西。

這篇論文或許不會改變?nèi)魏握谶M(jìn)行中的 AI 開發(fā)路線圖，但它代表了一種聲音：來自一個在 AI 應(yīng)用于數(shù)學(xué)方面走在最前沿的實(shí)踐者，卻也愿意停下來問一些不那么容易回答的問題。

在結(jié)尾，陶哲軒和 Tanya 在腳注中寫道：“一個著名的 Tumblr 思想實(shí)驗(yàn)得出結(jié)論，一塊香草精含量達(dá)到 44% 的蛋糕是無法食用的。”盡管我們總是幻想著它更多一點(diǎn)更美味。這就好像目前的 AI 使用，適量添加可以增強(qiáng)和豐富作品，但如果 AI 內(nèi)容成為核心組成部分，將不會產(chǎn)生理想、有效或有價值的結(jié)果。

當(dāng)前 AI 的使用量或許大概還遠(yuǎn)沒到 44%，但在某些領(lǐng)域，例如學(xué)生作業(yè)、低質(zhì)量論文、社交媒體內(nèi)容……這個比例正在快速攀升。因此，論文的立場是，精靈已經(jīng)出了瓶子，試圖把它塞回去既不現(xiàn)實(shí)也可能弊大于利；現(xiàn)在的問題是如何與它共處，同時確保人類的需求、人類的創(chuàng)造力、人類的理解始終處于等式的核心。

1.https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/

2.https://arxiv.org/abs/2603.26524

運(yùn)營/排版：何晨龍

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.