![]()
你有沒有干過這種事——
手頭堆著十幾篇論文看不完,順手扔給AI:
“幫我總結(jié)一下核心觀點。”
然后AI叭叭叭吐出一段,你復(fù)制粘貼,完事。
如果你干過,接下來的內(nèi)容,可能會讓你后背一涼。
康奈爾大學(xué)和谷歌聯(lián)手,搞了一場“AI讀論文”的盲測。
結(jié)果出來了——
AI可能根本沒讀懂。
它只是在裝懂。
01. 這場測試,狠在哪兒?
![]()
研究人員干了一件很損的事。
他們先挑了一個連科學(xué)家都經(jīng)常吵架的領(lǐng)域:
高溫銅氧化物超導(dǎo)體。
這玩意兒,人類研究了30多年,論文堆成山,到現(xiàn)在還沒扯清楚。
然后,他們往數(shù)據(jù)庫里塞了1726篇相關(guān)論文。
接著,他們出了67道題。
注意,這不是那種“本文主要研究了什么”的傻瓜題。
而是需要——
綜合多個研究的結(jié)論,
判斷學(xué)術(shù)爭議的對錯,
甚至要做點科學(xué)推理。
說白了:這題是給科學(xué)家出的,不是給AI玩的。
02. 參賽選手:五大AI + 12個真人
![]()
他們把市面上能叫上名字的AI全拉來了:
ChatGPT-4
Claude 3.5
Perplexity AI
Gemini Advanced 1.5 Pro
NotebookLM
然后又找了12個真正的科學(xué)家。
玩法更狠:
盲評。
12個專家只看答案,不知道是人寫的還是AI寫的。
就像《蒙面歌王》,只聽聲音不看臉。
03. 結(jié)果:AI露餡了
![]()
先說好消息。
能“讀論文”的AI,確實比只會搜網(wǎng)頁的AI強。
比如NotebookLM這種,允許你上傳論文的,回答問題時明顯靠譜。
因為它是在你給的資料里找答案,不是去網(wǎng)上瞎編。
但壞消息更扎心。
AI最大的死穴:看不懂圖。
搞科研的人都知道,論文里最值錢的不是文字,是圖——
曲線圖、相圖、實驗照片、統(tǒng)計表……
很多結(jié)論,都在圖里藏著。
但AI到了這兒,直接翻車。
它能復(fù)述文字結(jié)論,但你要它解釋“這張圖的縱坐標(biāo)為什么取對數(shù)”——
它就開始胡扯了。
研究人員直接撂了一句狠話:
“理解可視化數(shù)據(jù),是科學(xué)家最基本的素養(yǎng)。現(xiàn)在的AI,在這一項上,不及格。”
04. 更尷尬的:AI會自己編論文
![]()
這才是讓學(xué)術(shù)界最慌的地方。
測試?yán)锇l(fā)現(xiàn),有些AI回答問題時,會——
引用根本不存在的論文,
拼錯參考文獻的作者名,
把復(fù)雜的學(xué)術(shù)爭論簡單化、甚至歪曲化。
說白了:
它編得像真的一樣。
康奈爾大學(xué)的那位教授(原諒我一時沒記住他全名,反正挺長)在接受采訪的時候說了一句話,我覺得特別到位:
“AI就像一個特別自信的實習(xí)生,你問什么他都能接上話,但你回頭一查,他說的有一半是瞎編的。”
在學(xué)術(shù)界,一個錯誤引用,能把整篇研究帶溝里去。
05. 科學(xué)家開始怕了
![]()
現(xiàn)在學(xué)術(shù)界有個趨勢:
越來越多研究生在用AI讀論文、寫綜述。
如果AI在引用上出錯,
如果AI理解錯了圖表,
如果AI把A和B兩個矛盾的觀點強行捏在一起——
這些錯誤,可能會像病毒一樣,在論文里不斷復(fù)制、傳播。
有人已經(jīng)開始擔(dān)心一個更極端的未來:
AI寫論文 →
AI讀論文 →
AI引用AI寫的論文 →
最后人類科學(xué)家成了旁觀者,看著一堆機器在那里自說自話。
到時候,
科學(xué)研究會不會變成一場“機器之間的對話”?
而人類,根本不知道真相在哪兒就偏離了。
06. 最扎心的那句話
![]()
研究團隊在論文最后,寫了一段話,我看了好幾遍:
“AI在提取信息方面表現(xiàn)不錯,但在理解科學(xué)推理方面仍然有限。”
翻譯成大白話:
它能認字,但不一定懂科學(xué)。
07. 寫在最后
![]()
當(dāng)然,我不是說AI沒用。
它確實能幫我們省時間,快速翻文獻、找資料。
但如果你指望它替你“理解”一篇論文——
那你可能要失望了。
有些東西,比如:
懷疑、直覺、爭論、靈感……
可能真的,暫時還只屬于人類。
(評論區(qū)聊聊:你有沒有被AI“編”過?我用它寫論文,它給我造了一篇假文獻……)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.