337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

谷歌把這技術藏了3年,500步訓練讓7個模型"自動組隊"

0
分享至

聯邦學習(Federated Learning)有個老毛病:各家公司把模型練得再精,合起來反而更差。KALAVAI團隊用一套新機制,讓7個獨立訓練的"專科醫生"自動學會會診——全程不交換任何原始數據。

數據不出域,模型怎么"抱團"

傳統思路是中央集權:把數據收上來,練一個大模型。但醫療、金融、小語種場景里,數據根本動不了。KALAVAI反過來操作:把基礎模型 checkpoint(檢查點)分發出去,各參與方用自己的數據微調,再把模型權重交回來。

這里有個反直覺的點:模型 diverge(發散)得越厲害,融合后效果越好。如果各方數據太像,微調后的模型長得差不多,融合就是七個克隆人開會,毫無意義。只有數據足夠多樣,模型參數"各奔東西",才能互補。

谷歌研究院 2022 年的實驗顯示,用 KALAVAI 融合 7 個語言專家模型,在低資源語言任務上比單模型平均提升 23%。關鍵是,整個路由網絡只訓了 500 步——相當于讓七個專家在半小時內學會互相打配合。

500步訓練的"門控系統"

融合的核心是個輕量級 Mixture of Experts(混合專家)路由。它不看原始數據,只看輸入 token 的特征,實時決定該激活哪個專家。門控函數的權重直接對應"這個輸入更像誰的專業領域"。

訓練路由用的是混合數據——從各專家的訓練集里采樣拼湊。這里容易翻車:如果路由過擬合,見到陌生輸入就懵;如果學歪了,把法語句子派給阿拉伯語專家,直接 domain mismatch(領域錯配)。KALAVAI 的解法是把驗證集誤差寫進損失函數,強制路由保持"謙虛"。

整個流程零梯度共享、零數據共享。參與方只上傳最終的模型權重,連訓練過程中的中間狀態都不暴露。這比傳統的聯邦平均(FedAvg)更進一步——后者好歹還要傳梯度。

誰該緊張,誰該興奮

對小語種研究者,這是救命稻草。斯瓦希里語、冰島語的數據持有者再也不用把語料交給大廠,自己訓完模型,扔個 checkpoint 進池子就行。對醫療 AI 更關鍵:醫院 A 的腫瘤數據、醫院 B 的心電數據,這輩子不可能見面,但兩個專科模型可以融合成一個"全科醫生"。

但有個隱藏成本:路由的 inference(推理)開銷。每處理一個 token 都要計算 7 個專家的輸出再加權,延遲比單模型高 40% 左右。KALAVAI 團隊的建議是——用稀疏激活,每次只跑 top-2 專家,把開銷壓到 15% 以內。

2024 年 3 月,Hugging Face 社區有人復現了 KALAVAI 的簡化版,用 4 個 7B 模型融合出一個"免費 GPT-4 替代品"。帖子底下最高贊的評論是:"終于不用求爺爺告奶奶要數據了。"

如果每個醫院都能貢獻一個專科模型,卻不泄露任何病例——你覺得最先落地的會是腫瘤篩查,還是罕見病診斷?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
家電三巨頭差距斷崖:美的凈利潤385億,海爾187億,格力令人意外

家電三巨頭差距斷崖:美的凈利潤385億,海爾187億,格力令人意外

有范又有料
2026-03-24 10:59:07
林毅夫:直到2035年,中國GDP依舊有8%的增長潛力

林毅夫:直到2035年,中國GDP依舊有8%的增長潛力

經濟觀察報
2026-03-25 10:14:11
國產螺絲刀在海外躥紅,在TikTok狂賣2800萬

國產螺絲刀在海外躥紅,在TikTok狂賣2800萬

跨境派Pro
2026-03-23 14:16:59
沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國別造島

沖突加劇,日本援兵趕到,中方直接封海四天,越南警告中國別造島

云上烏托邦
2026-03-24 14:50:45
美軍發布戰果,摧毀中國產戰機,伊朗空軍損失殆盡

美軍發布戰果,摧毀中國產戰機,伊朗空軍損失殆盡

愛吃醋的貓咪
2026-03-22 22:29:08
張雪峰傳奇人生揭秘:父母下崗,大學考上鄭大,第一份工作開飯店

張雪峰傳奇人生揭秘:父母下崗,大學考上鄭大,第一份工作開飯店

談史論天地
2026-03-25 07:26:54
大快人心!國家出手擒下3名華人首富,他們干的事,根本不能饒恕

大快人心!國家出手擒下3名華人首富,他們干的事,根本不能饒恕

墨印齋
2026-03-24 21:34:56
日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

日本不再歡迎中國人?3月起日本簽證“一刀切”,華人進退兩難!

網絡易不易
2026-03-25 10:25:44
成事不足敗事有余的馬英九,又一次給國民黨惹下大禍了!

成事不足敗事有余的馬英九,又一次給國民黨惹下大禍了!

達文西看世界
2026-03-25 09:30:05
奶粉企業在公交車上投廣告:“貞潔是女孩最高貴的嫁妝”

奶粉企業在公交車上投廣告:“貞潔是女孩最高貴的嫁妝”

黃河新聞網呂梁
2026-03-25 14:12:59
暫停21天后,中遠海運集運恢復遠東至阿聯酋、沙特、卡塔爾等中東地區新訂艙業務

暫停21天后,中遠海運集運恢復遠東至阿聯酋、沙特、卡塔爾等中東地區新訂艙業務

澎湃新聞
2026-03-25 16:30:31
研究所所長被曝涉嫌猥褻下屬,信達證券回應:已暫停其一切工作,并啟動內部核查,積極配合公安工作

研究所所長被曝涉嫌猥褻下屬,信達證券回應:已暫停其一切工作,并啟動內部核查,積極配合公安工作

澎湃新聞
2026-03-25 13:50:27
“廉價的女留子,就是這種下場”,現狀被15萬人圍觀,看清了現實

“廉價的女留子,就是這種下場”,現狀被15萬人圍觀,看清了現實

妍妍教育日記
2026-03-23 20:50:12
新版人民幣已正式落地,紙幣將被取代?蘇州試點6年揭示了答案

新版人民幣已正式落地,紙幣將被取代?蘇州試點6年揭示了答案

花寒弦絮
2026-03-25 05:20:04
瑞典足協主席:我們不會抵制世界杯,但FIFA向特朗普頒和平獎有些越界

瑞典足協主席:我們不會抵制世界杯,但FIFA向特朗普頒和平獎有些越界

懂球帝
2026-03-24 20:28:07
出獄后的雷政富滄桑感襲面而來,前后對比引人唏噓

出獄后的雷政富滄桑感襲面而來,前后對比引人唏噓

霹靂炮
2026-03-14 22:49:47
日本收到最后通牒,再挑釁中國就會被徹底踢開,高市有辦法應對?

日本收到最后通牒,再挑釁中國就會被徹底踢開,高市有辦法應對?

愛下廚的阿釃
2026-03-25 14:46:01
美軍計劃增兵中東 對伊朗地面戰爭要來了?

美軍計劃增兵中東 對伊朗地面戰爭要來了?

看看新聞Knews
2026-03-24 19:12:06
CCTV5直播!國足VS世界杯魚腩 首發曝光:已定5人 邵佳一重用老將

CCTV5直播!國足VS世界杯魚腩 首發曝光:已定5人 邵佳一重用老將

侃球熊弟
2026-03-25 13:40:12
給機關事業單位退休人員發生活補貼合理合規,看看這些地方的做法

給機關事業單位退休人員發生活補貼合理合規,看看這些地方的做法

郭愛華追問教育
2026-03-25 06:25:09
2026-03-25 17:43:00
野生運營
野生運營
懂點產品,懂點AI,正在努力給平淡日子搞點新花樣。
31文章數 0關注度
往期回顧 全部

科技要聞

紅極一時卻草草收場,Sora宣布正式關停

頭條要聞

"軍工虎"譚瑞松獲死緩:搞權色交易 多次泄露內幕信息

頭條要聞

"軍工虎"譚瑞松獲死緩:搞權色交易 多次泄露內幕信息

體育要聞

35歲替補門將,憑什么入選英格蘭隊?

娛樂要聞

張雪峰經搶救無效不幸去世 年僅41歲

財經要聞

管濤:中東局勢如何影響人民幣匯率走勢?

汽車要聞

智己LS8放大招 30萬內8系旗艦+全線控底盤秀實力

態度原創

本地
家居
教育
手機
時尚

本地新聞

來永泰同安 赴一場春天的約會

家居要聞

輕奢堇天府 小資情調

教育要聞

正確率5%,不少人答錯的解方程

手機要聞

廢舊手機回收價大漲 去年回收價20元的舊手機今年漲到180

告別黑白灰,春天穿“奶油色”真的很好看

無障礙瀏覽 進入關懷版