337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

人工智能在某些創造力測試中超越普通人

0
分享至

研究人員對人工智能和10萬名人類進行了創造力測試。 人工智能可以超越普通人類的創造力——但最具想象力的頭腦仍然無疑是人類的。

  • 日期:
  • 2026年1月25日
  • 蒙特利爾大學
  • 概括:
  • 一項大規模的新研究對比了超過10萬名人類和當今最先進的人工智能系統,得出了一個令人驚訝的結果:生成式人工智能在某些創造力測試中已經能夠超越普通人類。像GPT-4這樣的模型在旨在衡量原創思維和創意生成的任務中表現出色,有時甚至超越了典型的人類反應。但人工智能的上限依然存在。最具創造力的人類——尤其是排名前10%的人群——仍然遠遠領先于人工智能,尤其是在詩歌和故事創作等更復雜的創意工作方面。

最新研究表明,人工智能在某些創造力測試中能夠超越普通人——這對于生成模型而言是一個引人注目的轉折點。圖片來源:Shutterstock

像 ChatGPT 這樣的生成式人工智能系統真的能創造出原創的想法嗎?蒙特利爾大學心理學系的 Karim Jerbi 教授領導的一項新研究,并邀請了著名人工智能研究員 Yoshua Bengio 參與,以前所未有的規模探討了這個問題。這項研究是迄今為止對人類創造力和大型語言模型創造力進行的最大規模的直接比較。

這項發表在《科學報告》(自然系列)上的研究指出,人工智能的發展正經歷著重大轉變。生成式人工智能系統如今已達到在某些創造力指標上超越普通人類的水平。與此同時,最具創造力的人仍然展現出明顯且持續的優勢,甚至超越了最強大的人工智能模型。

人工智能達到人類平均創造力水平

研究人員評估了包括 ChatGPT、Claude、Gemini 等在內的幾種領先的大型語言模型,并將它們的性能與超過 10 萬名人類參與者的測試結果進行了比較。研究結果凸顯了一個明顯的轉折點。一些人工智能系統,例如 GPT-4,在旨在衡量語言創造力差異的任務中,其表現甚至超過了人類的平均水平。

“我們的研究表明,一些基于大型語言模型的AI系統在特定任務上的表現已經超越了人類的平均創造力,”卡里姆·杰爾比教授解釋說。“這一結果或許令人驚訝,甚至令人不安,但我們的研究也凸顯了一個同樣重要的觀察結果:即使是最好的AI系統,其創造力水平仍然不及最具創造力的人類。”

該研究的共同第一作者,蒙特利爾大學的博士后研究員安托萬·貝勒馬爾-佩潘和康考迪亞大學的博士候選人弗朗索瓦·萊斯皮納斯進行的進一步分析揭示了一個引人注目的模式。盡管一些人工智能模型現在的表現已經超越了普通人,但創造力的巔峰仍然牢牢掌握在人類手中。

事實上,當研究人員考察最具創造力的那半數參與者時,他們的平均得分超過了所有測試過的AI模型。而在最具創造力的前10%人群中,這種差距甚至更大。

“我們與多倫多大學的杰伊·奧爾森合作,基于超過 10 萬名參與者的數據,開發了一個嚴謹的框架,使我們能夠使用相同的工具比較人類和人工智能的創造力,”卡里姆·杰爾比教授說道,他同時也是 Mila 的副教授。

科學家如何衡量人類和人工智能的創造力

為了公平地評估人類和機器的創造力,研究團隊采用了多種方法。主要工具是發散聯想任務(DAT),這是一種廣泛使用的心理測試,用于測量發散創造力,即根據單一提示產生多樣化原創想法的能力。

由該研究的合著者杰伊·奧爾森(Jay Olson)創建的DAT測試要求參與者(無論是人類還是人工智能)列出十個含義盡可能不相關的單詞。一個極具創意的回答示例包括“星系、叉子、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風、光合作用”等單詞。

這項任務的表現與寫作、創意生成和創造性問題解決等其他成熟的創造力測試結果密切相關。雖然這項任務以語言為基礎,但它遠不止于詞匯量。它調動了跨多個領域創造性思維所涉及的更廣泛的認知過程。DAT 還具有實用優勢,只需兩到四分鐘即可完成,并且公眾可以在線訪問。

從詞匯表到真正的創意寫作

研究人員隨后探索了人工智能在這種簡單的詞語聯想任務上的成功是否能夠推廣到更復雜、更貼近現實的創意活動中。為了驗證這一點,他們將人工智能系統和人類參與者在創作俳句(一種三行短詩)、撰寫電影劇情簡介和創作短篇小說等創意寫作挑戰中的表現進行了比較。

結果遵循著熟悉的模式。雖然人工智能系統有時表現優于普通人類,但技藝最精湛的人類創作者始終能創作出更優秀、更具原創性的作品。

人工智能的創造力可以調整嗎?

這些發現引出了另一個重要問題:人工智能的創造力是固定的,還是可以塑造的?研究表明,人工智能的創造力可以通過改變技術設置來調整,尤其是模型的溫度。這個參數控制著生成響應的可預測性或創新性。

在較低溫度設置下,人工智能會產生更安全、更常規的輸出結果。在較高溫度下,響應會變得更加多樣化、更難以預測,也更具探索性,從而使系統能夠超越既有的思維模式。

研究人員還發現,創造力很大程度上受指令編寫方式的影響。例如,鼓勵模型運用詞源學思考詞源和結構的提示,能夠帶來更多意想不到的聯想,并提升創造力得分。這些結果強調,人工智能的創造力高度依賴于人類的指導,因此交互和提示是創造過程的核心組成部分。

人工智能會取代人類創作者嗎?

這項研究對人工智能可能取代創意專業人士的擔憂提出了較為平衡的觀點。雖然人工智能系統在某些任務上已經能夠達到甚至超越人類的平均創造力水平,但它們仍然存在明顯的局限性,并且需要依賴人類的指導。

“盡管人工智能在某些測試中已經能夠達到人類的創造力水平,但我們需要超越這種誤導性的競爭觀念,”卡里姆·杰爾比教授說道。“生成式人工智能首先已經成為服務于人類創造力的極其強大的工具:它不會取代創造者,而是會深刻地改變人們想象、探索和創造的方式——對于那些選擇使用它的人來說。”

研究結果并非預示著創意職業的終結,而是表明人工智能未來將成為創意助手。通過拓展思路、開辟新的探索路徑,人工智能或許能夠增強而非取代人類的想象力。

“通過直接比較人類和機器的能力,像我們這樣的研究促使我們重新思考創造力的含義,”卡里姆·杰爾比教授總結道。

關于這項研究

題為“人類和大型語言模型中的發散性創造力”的論文于 2026 年 1 月 21 日發表在《科學報告》上。該研究匯集了來自蒙特利爾大學、康考迪亞大學、多倫多大學密西沙加分校、魁北克人工智能研究所 (Mila) 和谷歌 DeepMind 的科學家。

這項研究由卡里姆·杰爾比教授領導,安托萬·貝勒馬爾-佩潘(蒙特利爾大學)和弗朗索瓦·萊斯皮納斯(康考迪亞大學)共同擔任第一作者。研究團隊還包括約書亞·本吉奧,他是Mila和LoiZéro的創始人,也是深度學習領域的先驅,而深度學習正是ChatGPT等現代人工智能系統背后的技術。

  1. Antoine Bellemare-Pepin、Fran?ois Lespinasse、Philipp Th?lke、Yann Harel、Kory Mathewson、Jay A. Olson、Yoshua Bengio、Karim Jerbi.人類的發散性創造力與大型語言模型.科學報告, 2026; 16 (1) DOI: 10.1038/s41598-025-25157-3

引用此頁面

蒙特利爾大學。“研究人員對人工智能和10萬名人類的創造力進行了測試。” ScienceDaily。ScienceDaily,2026年1月25日。 / releases / 2026 / 01 / 260125083356.htm>。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上海勝山西最大功臣揭曉,非李永煒李添榮,冠軍相顯現

上海勝山西最大功臣揭曉,非李永煒李添榮,冠軍相顯現

吳朑愛游泳
2026-03-25 23:04:43
山東省政協原常委、人口資源環境委員會原副主任李興軍被公訴

山東省政協原常委、人口資源環境委員會原副主任李興軍被公訴

新浪財經
2026-03-25 16:25:15
祖比門迪該讓位了!阿森納新賴斯已就位,阿爾特塔可以動手了

祖比門迪該讓位了!阿森納新賴斯已就位,阿爾特塔可以動手了

瀾歸序
2026-03-26 04:51:37
上海樓市狂飆!但這波小陽春,和你想的完全不一樣

上海樓市狂飆!但這波小陽春,和你想的完全不一樣

地產大爆炸
2026-03-25 20:47:20
拒絕婚檢!吉林準新娘發帖怒斥,既然不信任我,為何還要跟我結婚

拒絕婚檢!吉林準新娘發帖怒斥,既然不信任我,為何還要跟我結婚

火山詩話
2026-03-23 16:50:31
0.028%!無罪判決率跌至谷底,為何國際水平是我們的35倍?

0.028%!無罪判決率跌至谷底,為何國際水平是我們的35倍?

深析古今
2026-03-25 01:10:47
樓市釋放重磅信號!李嘉誠家族重返房地產,央媒76字直接定調

樓市釋放重磅信號!李嘉誠家族重返房地產,央媒76字直接定調

復轉這些年
2026-03-24 11:03:55
拒給侄子擔保80萬,大哥罵我無情,我卻查到他早已偷偷轉移了財產

拒給侄子擔保80萬,大哥罵我無情,我卻查到他早已偷偷轉移了財產

千秋文化
2026-03-24 21:39:05
結束10年曼城執教生涯?英媒:瓜迪奧拉今夏離任 候選有兩大弟子

結束10年曼城執教生涯?英媒:瓜迪奧拉今夏離任 候選有兩大弟子

智道足球
2026-03-25 13:32:37
中國股市:2026妖股名單泄露!這20只股將一飛沖天!

中國股市:2026妖股名單泄露!這20只股將一飛沖天!

得歸林下
2026-03-25 14:55:36
陜西檢察長陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

陜西檢察長陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

午夜故事會
2024-04-15 18:31:39
多接觸女性的隱秘好處:第2個很多男人一輩子沒明白

多接觸女性的隱秘好處:第2個很多男人一輩子沒明白

夏末moent
2026-03-12 11:38:54
鈣是牛肉的10倍,鐵是豬肝的3倍,中老年使勁吃,腿腳有勁精神足

鈣是牛肉的10倍,鐵是豬肝的3倍,中老年使勁吃,腿腳有勁精神足

阿龍美食記
2026-03-22 14:37:41
普京即將訪華!不讓美只手遮天,拉夫羅夫確認,中俄要聯手辦大事

普京即將訪華!不讓美只手遮天,拉夫羅夫確認,中俄要聯手辦大事

安夢入天下
2026-03-26 04:59:12
快訊!中國和伊朗談妥了!

快訊!中國和伊朗談妥了!

達文西看世界
2026-03-25 15:51:56
你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

你見過哪些悶聲發大財的人?網友:干這個買三套房子,兩個門面

夜深愛雜談
2026-02-01 18:57:04
“低調的狠人”接替拉里賈尼,分析人士:無論誰與美談判,達成什么協議,都得經他批準

“低調的狠人”接替拉里賈尼,分析人士:無論誰與美談判,達成什么協議,都得經他批準

紅星新聞
2026-03-25 16:03:18
2026年起,黨齡50年以上老黨員,可領兩金,趕緊轉告

2026年起,黨齡50年以上老黨員,可領兩金,趕緊轉告

荷蘭豆愛健康
2026-03-24 17:05:24
呂迪格:皇馬知我激進有度,9年無紅+季均5黃為證

呂迪格:皇馬知我激進有度,9年無紅+季均5黃為證

體壇周報
2026-03-25 16:16:12
俄羅斯人想不明白:為什么強大的中國,幾千年都不要西伯利亞?

俄羅斯人想不明白:為什么強大的中國,幾千年都不要西伯利亞?

賤議你讀史
2026-03-26 00:07:41
2026-03-26 06:15:00
科學的歷程 incentive-icons
科學的歷程
吳國盛、田松主編
3158文章數 15010關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

伊朗軍方稱擊落美軍F-18戰機 現場畫面披露

頭條要聞

伊朗軍方稱擊落美軍F-18戰機 現場畫面披露

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰遺產分割復雜!是否立遺囑成關鍵

財經要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態度原創

數碼
教育
親子
公開課
軍事航空

數碼要聞

英特爾發布基于第三代酷睿Ultra處理器vPro平臺

教育要聞

雄安新區:北京史家胡同小學分校,傳承“和諧教育”理念

親子要聞

爸爸的肩膀,永遠是你最堅實的依靠

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗重申非交戰國家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進入關懷版