337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

RAG神話破滅?斯坦福頂尖團隊新研究:合成數據訓練效果反超,成本大降

0
分享至


在大模型商業化落地的進程中,醫療、金融等高精尖垂直領域,始終面臨著一個核心難題:既要嚴控回答準確率、杜絕AI幻覺,又要控制部署成本,適配更多實際應用場景。長期以來,業內早已形成定論,檢索增強生成(RAG)是破解這一難題的最優方案,甚至成為行業默認的標準答案。

直到2026年3月,一支集結了全球頂尖院校力量的科研團隊,用一項重磅研究成果,徹底打破了這一固化格局。

斯坦福大學教授、NLP領域頂級學者、麥克阿瑟天才獎得主、大模型常識推理與對齊領域領軍人物Yejin Choi,聯合斯坦福大學副教授James Zou,帶領來自斯坦福大學的Seungju Han、Konwoo Kim、Suhas Kotha、麻省理工學院(MIT)的Chanwoo Park、華盛頓大學的Benjamin Newman、Jaehun Jung多位青年科研骨干,在arXiv平臺發布最新論文《Synthetic Mixed Training: Scaling Parametric Knowledge Acquisition Beyond RAG》,用嚴謹詳實的實驗數據,完成了一次對傳統技術路線的顛覆。

這支科研夢之隊,在大量對照實驗中,揭開了一個被行業長期忽視的真相:

傳統合成數據效果不及RAG,從來不是數據本身存在缺陷,而是使用方式存在誤區。

該研究通過改良訓練模式、優化數據配比,團隊成功盤活合成數據潛力,實現了對主流RAG方案的反超,為大模型垂直領域適配,開辟了一條低成本、高效率的全新路徑。


被低估的合成數據:常年淪為配角,并非能力不足

談及大模型落地垂直領域,RAG技術早已占據不可撼動的地位。通俗來講,RAG就像是為大模型配備了一座隨身外部知識庫,遇到模糊不清的問題、專業性極強的知識點,模型無需依賴自身有限的預訓練記憶,而是實時檢索外部資料,邊查證邊作答,最大限度降低幻覺出錯率,這也是它能牢牢占據金融、醫療等高精準度賽道的核心原因。

與之相對,合成數據訓練,一直被視作RAG的輔助手段。業內普遍認為,依靠合成數據微調的模型,知識儲備有限、性能提升存在天花板,即便大量堆砌數據、更換更強的生成模型,效果也始終無法趕超RAG,兩者之間仿佛存在一道難以逾越的鴻溝。

這支頂尖團隊最初也遭遇了同樣的瓶頸。在多輪測試中,單純使用合成問答對、或是僅用合成文檔訓練模型,性能提升都極為緩慢,即便加大數據投放量,效果也會快速觸頂,甚至比成熟RAG方案低4.6%。

經過反復復盤實驗,團隊終于找準了問題癥結:

單一類型的合成數據訓練,只能讓模型習得片面能力,無法實現知識與能力的融合。 合成問答對擅長訓練模型的推理邏輯、知識調用技巧,卻無法讓模型牢牢掌握專業細節; 合成文檔能填充垂直領域干貨,卻難以教會模型靈活運用知識。二者單打獨斗,自然無法突破性能上限。

針對這一核心短板,團隊徹底摒棄傳統單一訓練模式,提出兩大關鍵改良策略——合成混合訓練(SMT,Synthetic Mixed Training)聚焦重寫(Focal Rewriting),徹底釋放了合成數據的潛力。

SMT實現破局:讓AI從“開卷查資料”轉向“閉卷記知識”

如果把RAG比作開卷考試,允許隨時翻閱資料作答,那么SMT合成混合訓練,就是讓AI在訓練階段完成系統學習,把知識點內化成本身記憶,依靠自身實力應對各類問題。

SMT的核心邏輯簡潔卻直擊要害:將合成問答對與合成文檔按1:1比例混合,共同用于模型微調訓練

兩類數據形成完美互補,問答對負責錘煉模型的推理能力、解題思路,文檔負責灌輸專業領域知識,讓AI既懂邏輯方法,又有扎實儲備,擺脫片面學習的局限。

為了進一步提升訓練效率,避免模型耗費精力在冗余、重復的無效信息上,團隊還配套推出聚焦重寫技術。這項技術相當于為AI劃定核心考點,引導生成的文檔緊扣關鍵問題展開,剔除無關內容,讓模型集中吸收高價值知識點,大幅提升學習效率。


這套組合策略,交出了亮眼的成績單。論文實驗數據顯示,在長文本理解(QuALITY)、醫療專業問答(LongHealth)、金融分析研判(FinanceBench)三大權威測試場景中,通過SMT與Focal Rewriting組合策略微調的模型,實現了對傳統RAG的超越,在QuaLITY數據集上領先幅度高達4.4%。更具實用價值的是,將SMT訓練后的模型與RAG結合使用,性能可在原有基礎上再提升9.1%,實現雙重增效。



該技術對中小參數模型格外友好,8B及以下的輕量模型,僅需少量高質量合成數據,就能達到甚至超越傳統RAG的效果,無需堆砌海量算力,不用搭建復雜的檢索系統,大幅降低了企業落地門檻,讓中小廠商也能輕松布局垂直領域AI。

不止技術逆襲:改寫大模型行業競爭邏輯

SMT的價值,遠不止實驗室里的性能突破,更攪動了整個大模型行業的發展格局,打破了行業多年來“唯參數論、唯算力論”的慣性思維。

過去幾年,大模型行業陷入粗放式內卷,各大機構盲目比拼模型參數規模、投入算力大小,誤以為硬件越強,模型性能就越優。可隨著算力投入不斷加大,邊際效益持續遞減,這種野蠻生長的模式早已走到瓶頸。

SMT用實踐證明,精細化的數據處理與科學訓練,遠比盲目擴張硬件更具價值。不必執著于超大參數模型,不必耗費巨額算力成本,只要用對合成數據、優化訓練方式,就能實現質的性能飛躍,為行業開辟了輕量化發展的新路線。


與此同時,SMT進一步豐富了大模型落地體系。它并非要取代RAG,而是與RAG形成互補。RAG更適合知識需要實時更新的場景,SMT則適配離線環境、邊緣設備等無法聯網檢索的場景,二者靈活搭配,能覆蓋更多應用需求,適配更廣泛的行業場景。

當然,這項新技術仍有完善空間。


目前SMT在70B以上超大模型上的適配效果,還需更多實驗驗證,合成數據的質量管控、多樣性把控也有待進一步優化。但實驗中呈現的穩定增長趨勢,已經充分證明,合成數據訓練擁有巨大的挖掘空間與落地潛力。

結語:大模型行業,邁入精細化發展新階段

從RAG一家獨大,到合成數據成功逆襲,這場技術路線的革新,本質上是大模型行業從野蠻擴張走向深耕細作的重要標志。

Yejin Choi團隊的這項研究,不僅推翻了“合成數據弱于RAG”的行業共識,更為行業指明了新方向:比起堆砌參數、比拼算力,打磨數據質量、優化訓練模式,才是未來競爭的核心著力點。

對于企業而言,深耕高質量合成數據、布局高效訓練方法,將成為下一階段搶占市場的核心競爭力。對于整個行業來說,多元技術路線并行融合,將推動大模型落地更靈活、成本更親民、應用更廣泛,徹底告別粗放內卷,邁向效率與質量并重的高質量發展時代。

(本文首發鈦媒體APP,作者 | 硅谷Tech-news,編輯 | 趙虹宇)

聲明:包含AI生成內容

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
蔡磊透露身體近況:四個人同時攙扶也無法邁步,感覺最對不起的就是妻子

蔡磊透露身體近況:四個人同時攙扶也無法邁步,感覺最對不起的就是妻子

極目新聞
2026-03-29 22:40:10
奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

奧運冠軍“拉拉鏈露胸”,讓耐克繃不住了!

品牌營銷報
2026-02-23 11:31:10
太反常!別的國家越強越沒人敢惹,為啥中國越強,麻煩就越多

太反常!別的國家越強越沒人敢惹,為啥中國越強,麻煩就越多

小蘭聊歷史
2026-03-30 15:11:22
美國歷史,或將于本周三改寫!

美國歷史,或將于本周三改寫!

湊近看世界
2026-03-30 10:24:47
中東危機只是小菜?更大危機還在后面,外媒:中國將徹底顛覆戰場

中東危機只是小菜?更大危機還在后面,外媒:中國將徹底顛覆戰場

嘆知
2026-03-29 18:13:46
焦泊喬成籌碼?廣東可能進行交易,前國手有望加盟,曾獲杜鋒青睞

焦泊喬成籌碼?廣東可能進行交易,前國手有望加盟,曾獲杜鋒青睞

萌蘭聊個球
2026-03-30 08:19:53
霍啟山激動:嫂子我喜歡這個!郭晶晶:等著,嫂子給你要微信去!

霍啟山激動:嫂子我喜歡這個!郭晶晶:等著,嫂子給你要微信去!

拳擊時空
2026-03-28 07:07:19
烏克蘭認輸了?澤連斯基改口認慫,不到24小時,普京下達最新命令

烏克蘭認輸了?澤連斯基改口認慫,不到24小時,普京下達最新命令

近史閣
2026-03-30 12:19:48
歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

歐洲人在性方面有多開放?德國再創歷史!女廁所、女浴室隨便進了

西樓知趣雜談
2026-03-24 14:38:30
萬科12位高管被調查

萬科12位高管被調查

地產微資訊
2026-03-28 11:17:12
楊瀚森全程沒動手仍吃T!白扔2000美元太冤枉,主帥盛贊:很踏實

楊瀚森全程沒動手仍吃T!白扔2000美元太冤枉,主帥盛贊:很踏實

你的籃球頻道
2026-03-30 10:02:01
“斬首術”應該獲諾貝爾獎?如此“讓領導先走”,真是偉大創造嗎

“斬首術”應該獲諾貝爾獎?如此“讓領導先走”,真是偉大創造嗎

瑜說還休
2026-03-27 17:31:33
單依純明目張膽侵權他人作品,拒不道歉,李榮浩4連問硬剛到底

單依純明目張膽侵權他人作品,拒不道歉,李榮浩4連問硬剛到底

上觀新聞
2026-03-29 17:56:07
伊朗做好最壞打算,如果美國發動地面戰,將拉著周邊鄰國同歸于盡

伊朗做好最壞打算,如果美國發動地面戰,將拉著周邊鄰國同歸于盡

探史
2026-03-30 11:47:20
中國摩托的越南復仇:從“工業垃圾”到“平替神車”

中國摩托的越南復仇:從“工業垃圾”到“平替神車”

沙雕小琳琳
2026-03-28 10:15:55
洛桑去世真相:博林25年后坦白,他其實沒喝多少酒

洛桑去世真相:博林25年后坦白,他其實沒喝多少酒

觀察者海風
2026-03-26 23:12:53
曼聯夏窗鎖定23歲頂級中場!為截胡曼城,紅魔愿以他為核心建隊

曼聯夏窗鎖定23歲頂級中場!為截胡曼城,紅魔愿以他為核心建隊

仰臥撐FTUer
2026-03-30 13:28:08
開辟第二個戰場?美航母后撤,胡塞導彈砸向以色列,伊朗迎來強援

開辟第二個戰場?美航母后撤,胡塞導彈砸向以色列,伊朗迎來強援

張殿成
2026-03-30 16:02:05
朱孝天撕「賣情懷F4」標簽上陸綜 曾志偉嚇一跳:為什么要來?

朱孝天撕「賣情懷F4」標簽上陸綜 曾志偉嚇一跳:為什么要來?

ETtoday星光云
2026-03-30 09:50:17
塔圖姆轟32+5+8無緣今日最佳!對不起,你碰到暴走創紀錄的申京了

塔圖姆轟32+5+8無緣今日最佳!對不起,你碰到暴走創紀錄的申京了

世界體育圈
2026-03-30 12:41:58
2026-03-30 16:59:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
131516文章數 862037關注度
往期回顧 全部

科技要聞

DeepSeek性能異常問題已解決,服務恢復

頭條要聞

單套最低5400萬 北京豪宅暴雷幾十戶業主辦不了房產證

頭條要聞

單套最低5400萬 北京豪宅暴雷幾十戶業主辦不了房產證

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

油價沖擊,有些亞洲貨幣先扛不住了!

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

手機
旅游
藝術
公開課
軍事航空

手機要聞

三星舊機更新現隔空投送開關,卻無法使用?

旅游要聞

赴泰旅游價格或上漲,泰國擬向外國游客收300泰銖

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

無障礙瀏覽 進入關懷版