有人終于把那句話說(shuō)出來(lái)了。
一個(gè)27歲的天才,站在AI最前沿的位置,對(duì)著整個(gè)學(xué)術(shù)界說(shuō):你們選的題太簡(jiǎn)單,用的方法太復(fù)雜,最后只是為了證明自己提升了2%。
說(shuō)這話的人叫姚順雨。清華姚班畢業(yè),普林斯頓博士,OpenAI核心研究員,ReAct和思維樹(shù)框架的作者,被引用超過(guò)1.5萬(wàn)次,27歲入選MIT科技評(píng)論TR35榜單,中國(guó)區(qū)最年輕得主之一。現(xiàn)任騰訊首席AI科學(xué)家。
這不是一個(gè)外行在罵學(xué)術(shù)界。
這是一個(gè)從學(xué)術(shù)圈殺出來(lái)、又回頭看清了那個(gè)圈子全部底細(xì)的人,在說(shuō)一個(gè)所有人都心知肚明、但沒(méi)人敢公開(kāi)說(shuō)的事實(shí)。
這句話,值得每一個(gè)搞研究的人,認(rèn)真讀三遍。
01 用核反應(yīng)堆煮泡面,這叫“創(chuàng)新”?
姚順雨的原話是這樣的:
學(xué)術(shù)界存在一個(gè)弊病,他們會(huì)選擇簡(jiǎn)單的任務(wù),然后搭配非常復(fù)雜的方法,最后只是為了證明改進(jìn)了2%。方法的復(fù)雜程度,應(yīng)該和任務(wù)本身的難度相匹配。在某種程度上,現(xiàn)在的任務(wù)難度,已經(jīng)落后于研究方法的發(fā)展了。
這句話翻譯成大白話:這就像是為了煮一包泡面,你非要建一座核電站。電確實(shí)通了,水也熱了,面也熟了。
但你告訴我,這包泡面的味道,比用電水壺煮的好在哪里?
現(xiàn)在的AI頂會(huì)論文,給人一種極其荒謬的錯(cuò)覺(jué)。
任務(wù)簡(jiǎn)單嗎?簡(jiǎn)單得令人發(fā)指。
比如“情感分類”,就是判斷一句話是夸還是罵;比如“短文本匹配”,就是看兩句話是不是一個(gè)意思。這些任務(wù),五年前的BERT就已經(jīng)做得大差不差了。
方法復(fù)雜嗎?復(fù)雜得像天書(shū)。
為了在那個(gè)早已飽和的榜單上提升0.5%,他們?cè)O(shè)計(jì)了擁有幾千億參數(shù)的架構(gòu),引入了七八層的注意力機(jī)制,還要加上什么“對(duì)比學(xué)習(xí)”、“對(duì)抗訓(xùn)練”、“知識(shí)蒸餾”的全家桶。
姚順雨一針見(jiàn)血地指出:你的方法復(fù)雜度,必須和任務(wù)難度相匹配。
如果一個(gè)只有三層的網(wǎng)絡(luò)就能解決問(wèn)題,你非要用三百層,這不是能力,這是浪費(fèi),是炫技,是學(xué)術(shù)虛榮。
02 “2%改進(jìn)”背后的內(nèi)卷狂歡
為什么大家都在卷這2%?因?yàn)楹冒l(fā)論文。
真正的難題——比如通用人工智能(AGI)因果推理長(zhǎng)程記憶具身智能的物理交互——太難了,砸進(jìn)去幾個(gè)億可能連個(gè)水花都看不見(jiàn)。
但在公開(kāi)數(shù)據(jù)集上刷榜多容易啊!改改超參數(shù),換個(gè)激活函數(shù),加個(gè)正則項(xiàng),只要數(shù)字漲了一點(diǎn)點(diǎn),哪怕只有0就是一篇新論文。
于是,學(xué)術(shù)界變成了一個(gè)巨大的“養(yǎng)蠱場(chǎng)”。大家不再關(guān)心這個(gè)模型能不能幫醫(yī)生看片子,能不能幫律師審合同,能不能真的理解人類語(yǔ)言。大家只關(guān)心:我的數(shù)字是不是比你高?我的曲線是不是比你漂亮?
這不僅是自欺欺人,更是在阻礙技術(shù)的進(jìn)步。當(dāng)所有的聰明才智都用來(lái)在這個(gè)針尖大的地方做道場(chǎng),誰(shuí)去開(kāi)辟新的大陸?當(dāng)頂會(huì)論文變成了“如何在MNIST上刷到99.99%”的技巧大全,AI的未來(lái)在哪里?
03 任務(wù)難度,已經(jīng)配不上我們的工具了
姚順雨的觀點(diǎn)里,最讓我震驚的一句話是:“現(xiàn)在的任務(wù)難度,已經(jīng)落后于研究方法的發(fā)展了。”
這簡(jiǎn)直是振聾發(fā)聵。
我們手里握著ChatGPT、Claude、Gemini這樣的神兵利器,它們擁有近乎全人類的知識(shí)儲(chǔ)備。結(jié)果我們?cè)谟盟鼈兏墒裁矗吭谧鎏羁?strong>題。在做選擇題。在做小學(xué)水平的閱讀理解。
這是對(duì)智能的褻瀆。
我們的工具已經(jīng)進(jìn)化到了“星際戰(zhàn)艦”的級(jí)別,但我們的“戰(zhàn)場(chǎng)”還停留在“村口械斗”。如果你手里有一把加特林,你應(yīng)該去打坦克,而不是用來(lái)打蚊子。如果你有一個(gè)萬(wàn)億參數(shù)的模型,你應(yīng)該讓它去解決蛋白質(zhì)折疊,去控制核聚變,去探索宇宙的邊緣,而不是讓它去分辨“這句話是不是在罵人”。
真正的突破,永遠(yuǎn)來(lái)自于“降維打擊”。用最簡(jiǎn)單的方法解決最復(fù)雜的問(wèn)題,那是天才(比如愛(ài)因斯坦);用最復(fù)雜的方法解決最簡(jiǎn)單的問(wèn)題,那是內(nèi)卷的廢物。
![]()
04 學(xué)術(shù)界的病,全行業(yè)都在吃藥
別以為這只是學(xué)術(shù)界的事。工業(yè)界正在為學(xué)術(shù)界的這種“自嗨”買單。
多少公司的CTO,看了頂會(huì)論文覺(jué)得“高大上”,立刻招人復(fù)現(xiàn)。結(jié)果呢?部署上線一跑,延遲爆炸,成本翻倍,效果還不如原來(lái)的規(guī)則引擎。這就是典型的“學(xué)術(shù)幻覺(jué)”。
學(xué)術(shù)界在象牙塔里造神,工業(yè)界在泥濘里掙扎求生。姚順雨的炮轟,其實(shí)是在警告所有人:如果不改變這種“為了發(fā)論文而科研”的評(píng)價(jià)體系,AI的下一個(gè)冬天很快就會(huì)到來(lái)。
當(dāng)資本發(fā)現(xiàn),砸了幾十億美金,養(yǎng)出來(lái)的模型只是為了在榜單上前進(jìn)一名,而不能帶來(lái)實(shí)際的商業(yè)價(jià)值時(shí),泡沫就會(huì)破裂。
![]()
05 結(jié)語(yǔ):請(qǐng)把復(fù)雜留給世界,把簡(jiǎn)單留給自己
最后,我想對(duì)所有還在科研一線的人說(shuō):
不要做那個(gè)“把簡(jiǎn)單問(wèn)題復(fù)雜化”的聰明人,要做那個(gè)“把復(fù)雜問(wèn)題簡(jiǎn)單化”的智者。
如果你的方法很復(fù)雜,請(qǐng)確保你解決的問(wèn)題足夠難。如果你的任務(wù)很簡(jiǎn)單,請(qǐng)用最簡(jiǎn)單、最優(yōu)雅、最可解釋的方法去解決它。
在這個(gè)浮躁的時(shí)代,克制比炫技更難得,真實(shí)比刷榜更可貴。
姚順雨撕開(kāi)了一個(gè)口子,光透進(jìn)來(lái)了。希望我們都能看清這光的方向,而不是盯著腳下的陰影沾沾自喜。
別再用核反應(yīng)堆煮泡面了,把電留給更需要它的地方吧。
![]()
互動(dòng)問(wèn)題
你覺(jué)得現(xiàn)在的AI大模型,是在解決真問(wèn)題,還是在“刷榜”玩數(shù)字游戲?你見(jiàn)過(guò)最離譜的“為了復(fù)雜而復(fù)雜”的研究是什么?歡迎在評(píng)論區(qū)開(kāi)噴。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.