337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌最新研究:重復提示詞可將AI準確率從21.33%提升至97.33%

0
分享至


最近小編發現了一個效果出奇好的提示詞技巧,實測結果堪稱驚人。

谷歌一篇新論文《重復提示詞提升非推理型大語言模型性能》指出,在部分任務中,簡單重復提示詞就能將非推理型大語言模型的準確率從21.33%提升至97.33%。


乍聽之下,這說法簡直玄乎,讓人難以相信。但背后的原理其實無比簡單。

谷歌在70項不同的基準測試任務中開展了實驗,這種復制粘貼式的提示詞重復法:

? 在47項任務中表現優于基準模型

? 全程無一失手

? 帶來了肉眼可見的大幅性能提升,部分任務的準確率從約21%飆升至約97%



這個測試,覆蓋了 7 個主流模型:Gemini 2.0 Flash / Flash Lite、GPT-4o / GPT-4o-mini、Claude 3 Haiku / Claude 3.7 Sonnet、DeepSeek V3 等。

測試基準包括 ARC (Challenge)、OpenBookQA、GSM8K、MMLU-Pro、MATH,及自定義任務NameIndex、MiddleMatch。


對于選擇題任務,測試兩種順序,問題在前(Question-First)與選項在前(Options-First)。

那么,重復問題為何能起到這樣的效果?

論文給出了一個極具工程視角的解釋:大語言模型均以因果語言模型為基礎進行訓練,它們逐詞生成文本,嚴格遵循從左到右的順序,每個詞元只能“看到”其之前的內容。

當你重復問題時(比如將問題Q改寫為Q1+Q2),第二個副本中的每個詞元都能完整關聯第一個副本的全部信息。

實際上,這相當于在不改動模型、不增加推理步驟的前提下,讓模型獲得了回顧并重新梳理信息的機會。

類似的小技巧還有其他,比如清華大學此前發現的“先驗證”策略。

在其論文《Asking LLMs to Verify First is Almost Free Lunch》中,清華大學團隊提出了一個反直覺的思路:與其讓AI直接回答,不如先讓它"找茬"。

這個名為先驗證(Verification-First, VF)的策略簡單到令人難以置信:

傳統方式(Chain-of-Thought):


Q: 球棒和球問題...

A: 讓我一步步思考...

VF方式:


Q: 球棒和球問題...(提示:答案可能是"0.10元",先驗證它對不對,再給出正確答案)

A: 先驗證"0.10元"是否正確...

關鍵點:即使提供的答案是隨機的、錯誤的,甚至"1"這樣毫無意義的數字,VF依然有效!

結果是,這個"笨辦法"能讓AI推理準確率提升10-15%,而且幾乎不增加計算成本。

可見,讓人工智能變得“更聰明”,未必需要增加復雜度,只需優化提示詞的結構就夠了。

谷歌論文地址:https://arxiv.org/pdf/2512.14982


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
沖上熱搜!今年蚊子可能迎來史詩級加強?網友:遭不住了

沖上熱搜!今年蚊子可能迎來史詩級加強?網友:遭不住了

深圳晚報
2026-03-28 22:25:02
梁詠琪和雙胞胎弟弟一起過50歲生日,曬兩人童年和50歲對比照,網友:這么好看的臉,他家居然有倆

梁詠琪和雙胞胎弟弟一起過50歲生日,曬兩人童年和50歲對比照,網友:這么好看的臉,他家居然有倆

臺州交通廣播
2026-03-29 10:07:08
李榮浩發長文公開喊話單依純:在婉拒翻唱授權情況下,演唱會強行侵權演唱《李白》;其在《歌手》中翻唱導致他被調侃

李榮浩發長文公開喊話單依純:在婉拒翻唱授權情況下,演唱會強行侵權演唱《李白》;其在《歌手》中翻唱導致他被調侃

極目新聞
2026-03-29 15:16:06
女足亞冠巨大爭議!鄧夢曄進球被吹,主裁遭炮轟:99%誤判

女足亞冠巨大爭議!鄧夢曄進球被吹,主裁遭炮轟:99%誤判

奧拜爾
2026-03-29 19:27:15
向華強談張雪峰突然離世,直言其飲食不健康,重油重鹽有大問題

向華強談張雪峰突然離世,直言其飲食不健康,重油重鹽有大問題

娛樂E君
2026-03-27 12:47:59
大陸定性賴清德后,鄭麗文當眾爆料,民進黨瞞著2300萬臺胞的真相

大陸定性賴清德后,鄭麗文當眾爆料,民進黨瞞著2300萬臺胞的真相

知法而形
2026-03-29 19:03:17
女子家門未關嚴,流浪狗尾隨入室咬傷其腿,3天后狗死了,狂犬病毒檢測呈陽性;多方回應事件進展

女子家門未關嚴,流浪狗尾隨入室咬傷其腿,3天后狗死了,狂犬病毒檢測呈陽性;多方回應事件進展

大風新聞
2026-03-29 13:28:09
“直接崩了,一天掉了一百多元!”有人瘋狂拋售,國際巨頭接連發布新技術……格局將被改變?

“直接崩了,一天掉了一百多元!”有人瘋狂拋售,國際巨頭接連發布新技術……格局將被改變?

都市快報橙柿互動
2026-03-29 12:26:05
兩種葬禮,兩種人生,張雪峰和李詠的后事安排,差距真是一目了然

兩種葬禮,兩種人生,張雪峰和李詠的后事安排,差距真是一目了然

離離言幾許
2026-03-28 16:40:22
“憑什么判我死刑!”泰安入室搶嬰案庭審現場,主犯當庭破口大罵!

“憑什么判我死刑!”泰安入室搶嬰案庭審現場,主犯當庭破口大罵!

極目新聞
2026-03-29 15:16:06
印度發出最后警告:化肥不放行或致饑荒,14億人飯碗成危機

印度發出最后警告:化肥不放行或致饑荒,14億人飯碗成危機

阿傖說事
2026-03-29 17:44:45
好變態!1090投1000中!92%的命中率炸裂了!!

好變態!1090投1000中!92%的命中率炸裂了!!

柚子說球
2026-03-29 17:52:30
魂歸故里,長眠桑梓!張雪峰安葬地選址原因披露

魂歸故里,長眠桑梓!張雪峰安葬地選址原因披露

史海流年號
2026-03-29 12:14:27
為啥越來越多人開始懷疑學歷?上世紀70年代的諾獎論文早就說清了

為啥越來越多人開始懷疑學歷?上世紀70年代的諾獎論文早就說清了

知識圈
2026-03-29 13:10:14
心源性猝死來勢洶洶!呼吁:每家備好6樣東西,關鍵時刻能救命!

心源性猝死來勢洶洶!呼吁:每家備好6樣東西,關鍵時刻能救命!

阿兵科普
2026-03-28 20:08:11
新華時評 | 應盡快按下戰爭的“停止鍵”

新華時評 | 應盡快按下戰爭的“停止鍵”

新華社
2026-03-29 17:23:04
俄警告韓國勿向烏提供致命性武器

俄警告韓國勿向烏提供致命性武器

財聯社
2026-03-29 09:30:26
人民日報也發了粉底液將軍,居然有粉絲去沖人民日報,勸都勸不住

人民日報也發了粉底液將軍,居然有粉絲去沖人民日報,勸都勸不住

芊手若
2026-03-29 04:06:34
歌手吳向飛喊話李榮浩道歉:未取得授權公開演唱其歌曲;李榮浩回應:并未在個人演唱會或音樂節晚會唱過,請列明場次,若侵權一定賠償道歉

歌手吳向飛喊話李榮浩道歉:未取得授權公開演唱其歌曲;李榮浩回應:并未在個人演唱會或音樂節晚會唱過,請列明場次,若侵權一定賠償道歉

極目新聞
2026-03-29 18:56:41
德研究報告:中國工業數字化水平全球領先

德研究報告:中國工業數字化水平全球領先

新華社
2026-03-29 10:48:03
2026-03-29 21:19:00
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
466文章數 69關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創始人均離職

頭條要聞

中國警告美國:勿將"沖突戰亂"引入亞太地區

頭條要聞

中國警告美國:勿將"沖突戰亂"引入亞太地區

體育要聞

絕殺衛冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

張凌赫事件持續升級!官方點名怒批

財經要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態度原創

時尚
手機
本地
親子
教育

伊姐周日熱推:電視劇《冬去春來》;電視劇《你是遲來的歡喜》......

手機要聞

曝華為暢享90系列手機獨占智感暢行情景模式,支持智能路況提醒

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

親子要聞

寶藍和爸爸叔叔挑戰盲選三種顏色做彩泥,看看誰做的彩泥更漂亮!

教育要聞

1分鐘學會不規則圖形的面積計算方法!

無障礙瀏覽 進入關懷版