337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

RAG神話破滅?斯坦福頂尖團隊新研究:合成數據訓練效果反超,成本大降

0
分享至


在大模型商業化落地的進程中,醫療、金融等高精尖垂直領域,始終面臨著一個核心難題:既要嚴控回答準確率、杜絕AI幻覺,又要控制部署成本,適配更多實際應用場景。長期以來,業內早已形成定論,檢索增強生成(RAG)是破解這一難題的最優方案,甚至成為行業默認的標準答案。

直到2026年3月,一支集結了全球頂尖院校力量的科研團隊,用一項重磅研究成果,徹底打破了這一固化格局。

斯坦福大學教授、NLP領域頂級學者、麥克阿瑟天才獎得主、大模型常識推理與對齊領域領軍人物Yejin Choi,聯合斯坦福大學副教授James Zou,帶領來自斯坦福大學的Seungju Han、Konwoo Kim、Suhas Kotha、麻省理工學院(MIT)的Chanwoo Park、華盛頓大學的Benjamin Newman、Jaehun Jung多位青年科研骨干,在arXiv平臺發布最新論文《Synthetic Mixed Training: Scaling Parametric Knowledge Acquisition Beyond RAG》,用嚴謹詳實的實驗數據,完成了一次對傳統技術路線的顛覆。

這支科研夢之隊,在大量對照實驗中,揭開了一個被行業長期忽視的真相:

傳統合成數據效果不及RAG,從來不是數據本身存在缺陷,而是使用方式存在誤區。

該研究通過改良訓練模式、優化數據配比,團隊成功盤活合成數據潛力,實現了對主流RAG方案的反超,為大模型垂直領域適配,開辟了一條低成本、高效率的全新路徑。


被低估的合成數據:常年淪為配角,并非能力不足

談及大模型落地垂直領域,RAG技術早已占據不可撼動的地位。通俗來講,RAG就像是為大模型配備了一座隨身外部知識庫,遇到模糊不清的問題、專業性極強的知識點,模型無需依賴自身有限的預訓練記憶,而是實時檢索外部資料,邊查證邊作答,最大限度降低幻覺出錯率,這也是它能牢牢占據金融、醫療等高精準度賽道的核心原因。

與之相對,合成數據訓練,一直被視作RAG的輔助手段。業內普遍認為,依靠合成數據微調的模型,知識儲備有限、性能提升存在天花板,即便大量堆砌數據、更換更強的生成模型,效果也始終無法趕超RAG,兩者之間仿佛存在一道難以逾越的鴻溝。

這支頂尖團隊最初也遭遇了同樣的瓶頸。在多輪測試中,單純使用合成問答對、或是僅用合成文檔訓練模型,性能提升都極為緩慢,即便加大數據投放量,效果也會快速觸頂,甚至比成熟RAG方案低4.6%。

經過反復復盤實驗,團隊終于找準了問題癥結:

單一類型的合成數據訓練,只能讓模型習得片面能力,無法實現知識與能力的融合。 合成問答對擅長訓練模型的推理邏輯、知識調用技巧,卻無法讓模型牢牢掌握專業細節; 合成文檔能填充垂直領域干貨,卻難以教會模型靈活運用知識。二者單打獨斗,自然無法突破性能上限。

針對這一核心短板,團隊徹底摒棄傳統單一訓練模式,提出兩大關鍵改良策略——合成混合訓練(SMT,Synthetic Mixed Training)聚焦重寫(Focal Rewriting),徹底釋放了合成數據的潛力。

SMT實現破局:讓AI從“開卷查資料”轉向“閉卷記知識”

如果把RAG比作開卷考試,允許隨時翻閱資料作答,那么SMT合成混合訓練,就是讓AI在訓練階段完成系統學習,把知識點內化成本身記憶,依靠自身實力應對各類問題。

SMT的核心邏輯簡潔卻直擊要害:將合成問答對與合成文檔按1:1比例混合,共同用于模型微調訓練

兩類數據形成完美互補,問答對負責錘煉模型的推理能力、解題思路,文檔負責灌輸專業領域知識,讓AI既懂邏輯方法,又有扎實儲備,擺脫片面學習的局限。

為了進一步提升訓練效率,避免模型耗費精力在冗余、重復的無效信息上,團隊還配套推出聚焦重寫技術。這項技術相當于為AI劃定核心考點,引導生成的文檔緊扣關鍵問題展開,剔除無關內容,讓模型集中吸收高價值知識點,大幅提升學習效率。


這套組合策略,交出了亮眼的成績單。論文實驗數據顯示,在長文本理解(QuALITY)、醫療專業問答(LongHealth)、金融分析研判(FinanceBench)三大權威測試場景中,通過SMT與Focal Rewriting組合策略微調的模型,實現了對傳統RAG的超越,在QuaLITY數據集上領先幅度高達4.4%。更具實用價值的是,將SMT訓練后的模型與RAG結合使用,性能可在原有基礎上再提升9.1%,實現雙重增效。



該技術對中小參數模型格外友好,8B及以下的輕量模型,僅需少量高質量合成數據,就能達到甚至超越傳統RAG的效果,無需堆砌海量算力,不用搭建復雜的檢索系統,大幅降低了企業落地門檻,讓中小廠商也能輕松布局垂直領域AI。

不止技術逆襲:改寫大模型行業競爭邏輯

SMT的價值,遠不止實驗室里的性能突破,更攪動了整個大模型行業的發展格局,打破了行業多年來“唯參數論、唯算力論”的慣性思維。

過去幾年,大模型行業陷入粗放式內卷,各大機構盲目比拼模型參數規模、投入算力大小,誤以為硬件越強,模型性能就越優。可隨著算力投入不斷加大,邊際效益持續遞減,這種野蠻生長的模式早已走到瓶頸。

SMT用實踐證明,精細化的數據處理與科學訓練,遠比盲目擴張硬件更具價值。不必執著于超大參數模型,不必耗費巨額算力成本,只要用對合成數據、優化訓練方式,就能實現質的性能飛躍,為行業開辟了輕量化發展的新路線。


與此同時,SMT進一步豐富了大模型落地體系。它并非要取代RAG,而是與RAG形成互補。RAG更適合知識需要實時更新的場景,SMT則適配離線環境、邊緣設備等無法聯網檢索的場景,二者靈活搭配,能覆蓋更多應用需求,適配更廣泛的行業場景。

當然,這項新技術仍有完善空間。


目前SMT在70B以上超大模型上的適配效果,還需更多實驗驗證,合成數據的質量管控、多樣性把控也有待進一步優化。但實驗中呈現的穩定增長趨勢,已經充分證明,合成數據訓練擁有巨大的挖掘空間與落地潛力。

結語:大模型行業,邁入精細化發展新階段

從RAG一家獨大,到合成數據成功逆襲,這場技術路線的革新,本質上是大模型行業從野蠻擴張走向深耕細作的重要標志。

Yejin Choi團隊的這項研究,不僅推翻了“合成數據弱于RAG”的行業共識,更為行業指明了新方向:比起堆砌參數、比拼算力,打磨數據質量、優化訓練模式,才是未來競爭的核心著力點。

對于企業而言,深耕高質量合成數據、布局高效訓練方法,將成為下一階段搶占市場的核心競爭力。對于整個行業來說,多元技術路線并行融合,將推動大模型落地更靈活、成本更親民、應用更廣泛,徹底告別粗放內卷,邁向效率與質量并重的高質量發展時代。

(本文首發鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)

聲明:包含AI生成內容

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
跌麻了!筆記本開年銷量暴跌40%近乎腰斬:沒人買了

跌麻了!筆記本開年銷量暴跌40%近乎腰斬:沒人買了

中國能源網
2026-03-26 14:13:04
形勢有多嚴峻?35歲失業男與年輕女人事激烈碰撞,評論區炸鍋…

形勢有多嚴峻?35歲失業男與年輕女人事激烈碰撞,評論區炸鍋…

慧翔百科
2026-03-27 12:17:09
時代最令人失望者!加州州長怒批馬斯克:親手將美國電車王冠讓給了中國

時代最令人失望者!加州州長怒批馬斯克:親手將美國電車王冠讓給了中國

快科技
2026-03-27 14:18:12
4月1日醫保新規落地,41-61歲抓緊辦,3天內搞定,看病少花冤枉錢

4月1日醫保新規落地,41-61歲抓緊辦,3天內搞定,看病少花冤枉錢

老特有話說
2026-03-28 12:49:32
“新型出軌”正在朋友圈蔓延,比婚外情更隱蔽更傷人…

“新型出軌”正在朋友圈蔓延,比婚外情更隱蔽更傷人…

LULU生活家
2026-03-27 15:02:40
張凌赫事件持續升級!官方點名怒批,粉絲正面硬剛,這下恐要涼涼

張凌赫事件持續升級!官方點名怒批,粉絲正面硬剛,這下恐要涼涼

青橘罐頭
2026-03-28 22:13:21
尋釁滋事情節嚴重、影響惡劣 四川瀘縣5名未成年人被依法拘留

尋釁滋事情節嚴重、影響惡劣 四川瀘縣5名未成年人被依法拘留

紅星新聞
2026-03-28 09:48:14
《逐玉》張凌赫被嘲“粉底液將軍”,央視都看不下去了,發文力挺

《逐玉》張凌赫被嘲“粉底液將軍”,央視都看不下去了,發文力挺

娛樂故事
2026-03-26 17:11:11
大馬丁:這是我們踢得最差的比賽之一;這是一記及時的警鐘

大馬丁:這是我們踢得最差的比賽之一;這是一記及時的警鐘

懂球帝
2026-03-28 11:03:16
張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權

張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權

娛樂圈圈圓
2026-03-26 21:47:07
87歲華人神探李昌鈺去世,好友曝死法及晚年再婚

87歲華人神探李昌鈺去世,好友曝死法及晚年再婚

楓塵余往逝
2026-03-29 02:59:33
45名反中亂港分子在香港被判重刑,臺灣反應強烈,外交部犀利回應

45名反中亂港分子在香港被判重刑,臺灣反應強烈,外交部犀利回應

近史博覽
2026-03-28 20:31:38
有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
朝鮮導游對中國游客說,中國有幾個方面不如朝鮮,他們說的對嗎?

朝鮮導游對中國游客說,中國有幾個方面不如朝鮮,他們說的對嗎?

番外行
2026-03-29 00:15:03
0-4!孫興慜啞火 韓國爆冷輸非洲球隊 國足VS喀麥隆比賽時間確定

0-4!孫興慜啞火 韓國爆冷輸非洲球隊 國足VS喀麥隆比賽時間確定

侃球熊弟
2026-03-29 00:42:13
國家花幾十年把北大荒變成糧倉,為啥突然又要退耕還荒?背后真相讓人冒冷汗

國家花幾十年把北大荒變成糧倉,為啥突然又要退耕還荒?背后真相讓人冒冷汗

老杉說歷史
2026-03-26 20:20:05
在醫院你遭遇過最羞恥的事是什么?網友:一個比一個炸裂啊

在醫院你遭遇過最羞恥的事是什么?網友:一個比一個炸裂啊

解讀熱點事件
2026-02-04 00:05:07
毛主席曾預言:這兩個國家將來對中國最大威脅,如今果然應驗

毛主席曾預言:這兩個國家將來對中國最大威脅,如今果然應驗

鍋鍋愛歷史
2026-03-27 10:28:43
伊朗的“藩鎮化”:去中心化生存,還是國家解體的前夜?

伊朗的“藩鎮化”:去中心化生存,還是國家解體的前夜?

民間胡扯老哥
2026-03-27 07:01:25
16歲就是人間尤物,4年換19個男人,找老實人接盤后,變買菜媽媽

16歲就是人間尤物,4年換19個男人,找老實人接盤后,變買菜媽媽

一盅情懷
2026-03-28 15:38:13
2026-03-29 07:44:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
131483文章數 862024關注度
往期回顧 全部

科技要聞

華為盤古大模型負責人王云鶴確認離職

頭條要聞

上海爺叔在家"打傘做飯" 自嘲掏空三代400萬買了個啥

頭條要聞

上海爺叔在家"打傘做飯" 自嘲掏空三代400萬買了個啥

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

陳牧馳陳冰官宣得子 曬一家三口握拳照

財經要聞

臥底"科技與狠活"培訓:化工調味劑泛濫

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態度原創

房產
時尚
健康
旅游
游戲

房產要聞

首日430組來訪,單日120組認籌!海口首個真四代,徹底爆了!

和田曦薇一樣嫩嘟嘟,這3個變美技巧你一定不能錯過!

干細胞抗衰4大誤區,90%的人都中招

旅游要聞

泰安市岱岳區:賞梨花 看村晚 萬畝梨園迎客來

《異替》現已登陸Steam

無障礙瀏覽 進入關懷版