337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<tr id="2wwww"></tr>

<tfoot id="2wwww"><noscript id="2wwww"></noscript></tfoot>

<nav id="2wwww"></nav>

<nav id="2wwww"><sup id="2wwww"></sup></nav>

<noscript id="2wwww"><optgroup id="2wwww"></optgroup></noscript>

<nav id="2wwww"></nav>

<nav id="2wwww"><code id="2wwww"></code></nav>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

Meta億元天團首個大模型交卷！耗時九個月，一雪Llama前恥

2026-04-09 09:48:05　來源: 量子位

北京舉報

0

分享至

再見了，所有的羊駝。

亞歷山大王帶隊9個月從零重構Meta所有AI技術棧，在不斷的質疑中交出超級智能實驗室第一個模型：

主打原生多模態的Muse Spark。

模型發布后，Meta股價火速拉升約7%，中間一度漲超近10%，當日整體上漲6%左右。

市場的反應可謂相當熱烈。

隨手一扒你就會發現，這款模型背后藏著不少我們熟悉的高手：思維鏈作者Jason Wei、o1核心貢獻者Hyung Won Chung、被小扎天價挖來的余家輝、擴散模型核心人物宋飏……

嗯？當這群人湊在一起，很明顯你就會找到一個關鍵詞：推理。

沒錯，據Jason Wei爆料，9個月前他們坐在一起討論時，首先寫下的就是一款用于推理的llama模型腳本，而現在，完全體終于誕生。

而頂尖高手+耗時9個月打磨，Muse Spark也總算讓Meta在第三方測評中趕上第一梯隊，一雪llama 4帶來的前恥。

而且很有意思的一點是，Meta這次一反常態，沒有反復強調自己拿了多少SOTA，而是稍顯克制地表示：

Muse Spark在多模態感知、推理、健康和自主任務方面表現不錯，但在編程和長時間自主運行方面仍與對家的頂尖模型存在差距。

咳咳，看來之前llama 4確實給Meta留下了心理陰影（doge）。

另外，Muse Spark的出生也終于讓長期以來有關“Meta開閉源”的討論蓋棺定論：

這次是真閉源了。

目前這款模型已上線Meta網站和APP，API僅向部分合作伙伴開放。

（不過亞歷山大王還是留了個口子，表示“計劃未來開源后續版本”）

“Meta回來了”

老規矩，先看一波測評成績。

作為Meta迄今最強大的模型，Muse Spark這次主要在三個方面表現突出：

一是多模態理解能力。

不管是看論文圖表還是屏幕，各項得分要么第一、要么和Gemini 3.1 Pro、GPT 5.4等不相上下。

從網友們的測試來看，它好像尤為擅長圖片轉代碼。

當然文本能力也不差（doge），在網友的激情測試中，它就火速通過了新版弱智吧風格的洗車測試。

100米外有個洗車店，我該開車去還是走路去。
Muse Spark：洗車當然要把車開過去，但沒必要搞得跟上下班通勤似的。

（當然也不排除是數據污染的問題，畢竟問題出來也挺久了…）

再一個就是工具調用能力，測評情況也和多模態理解能力類似。

以及這次Muse Spark著重強調的醫學能力。

由于和1000+醫生展開了合作，它不僅在開放式健康問答HealthBench Hard上拿到42.8的最高分，而且在多模態醫學問答MedXpertQA MM中位居前列。

不過短板我們開頭也說了，Muse Spark仍在編程和Agent類任務上與其他頂尖選手存在差距。

可能也是為了盡量彌補這一點，他們這次還專門推出了Contemplating沉思模式。

主要是讓多個Agent同時思考同一個問題，然后匯總結果找出最好的。

在這套打法下，Muse Spark就能和Gemini Deep Think、 GPT Pro這類極限推理模式展開正面PK了。

比如在“人類最后的考試”中，Muse Spark明顯壓過一頭（不過在物理奧賽理論題中還是略遜一籌）。

（目前沉思模式正在Meta網站灰度測試）

另外值得一提的是，Meta這次無預告直接上線了“購物模式”。

亞歷山大王表示，模型會結合用戶在ins、Facebook、Threads上關注的創作者和品牌偏好，做個性化的購物推薦。

好好好，這次也不給你討論的機會了，之前OpenAI可沒少因為廣告挨罵。

目前，隨著Muse Spark測評一同出爐的，還有第三方機構的測評。

他們拿到Muse Spark的早期訪問權測了一波，然后給出了一個結論：Meta回來了！

在關鍵指標人工智能分析指數上，其得分僅次于Gemini 3.1 Pro、GPT-5.4和Claude Opus 4.6。

這也和Muse Spark自己給出的測評成績差不多。

對外界而言，初步來看，Muse Spark確實把Meta重新帶回了人工智能第一梯隊。

背后訓練細節

至于Muse Spark是如何做到這一點的，Meta也公布了背后的訓練細節。

核心其實就是亞歷山大王提到的：9個月重構一切。

新的基礎設施、新的架構、新的數據管道。

具體可以看網友給大家劃的重點：

在預訓練階段，能夠以比Llama 4 少10倍以上的計算量達到相同的性能水平。
強化學習訓練展現出平滑且可預測的改進，具有良好的泛化能力和可擴展性。
Test-time階段，在加入長度懲罰機制后，“思維壓縮”開始生效，模型學會了用更少的token解決問題。

Meta在博客中介紹，過去9個月，他們對Muse Spark的預訓練技術棧進行了全面升級。

所有改進的目標，都是為了讓每一分算力都能產生更大的價值。

為了驗證效果，他們做了一個對比實驗：先用一系列小模型擬合出一條“算力-能力”的Scaling曲線，然后計算要達到某個性能水平具體需要多少算力。

結果發現，相比Llama 4，Muse Spark達到同樣水平所需要的計算量低了一個數量級以上（10.3倍）。

預訓練完成后，他們進一步用強化學習來提升模型能力。

雖然大規模RL訓練通常很不穩定，但他們聲稱自己的新架構做到了“穩中有進”。

如下圖所示，隨著RL訓練步數增加，模型在訓練數據上的成功率（無論是單次嘗試還是16次中至少成功一次）呈現對數線性增長。

這說明，RL在提升可靠性的同時，沒有破壞推理的多樣性。

而且在模型從未見過的任務上，準確率同樣在穩步提升——這說明RL帶來的能力提升是可預測、可泛化的，不是死記硬背。

以及為了讓模型在回答復雜問題之前先“想一想”，團隊仍用強化學習訓練它具備這種“測試時推理”能力。

不過需要注意，實踐證明Test-time階段的推理尤為耗費token，所以如何精打細算也是這一階段的重點。

對此，他們用了兩個關鍵手段來平衡效果與效率：

一是思考時間懲罰。鼓勵模型用更短的推理路徑得出正確答案，倒逼它學會“思維壓縮”。

二是多智能體協作。讓多個模型或模塊協同工作，在保證響應速度不降的前提下提升整體表現。

然后在AIME這類高難度評測集上，他們觀察到了一個有趣的“三階段變化”：

模型一開始會不自覺延長思考，希望通過拉長推理過程來提高正確率。

但這會馬上觸發“思考時間懲罰”，于是模型被迫精簡推理，學會用更少的token解決問題。

而在精簡之后，模型還表現出了擴展性能——在高效的基礎上繼續優化解法，最終實現用更少的資源獲得更強的性能表現。

也不乏翻車的

不過前面也說了，Muse Spark雖然將Meta帶回了第一梯隊，但在編程、Agent類任務上仍有不足。

這不，模型剛發布，翻車集錦也來了……

有人想用它生成網站，結果3個請求一個都沒實現，而且連最基本的前端都無。

不過后來貼主發現可能是偶然錯誤，模型正常情況下做出來的前端是這樣的。

一個簡單的編程任務，Muse Spark雖生成了一大堆東西，但根本跑不通。

在一個Python文件里實現自動微分（autograd）和神經網絡。

網友甚至調侃，模型根本沒在學，訓練了1800個epoch，損失函數卻一直卡在同一個值上沒動過。

白白浪費算力了……

（正常情況下，隨著訓練進行損失應該逐步下降，表明模型在“學習”）

所以問題來了，有試過的朋友覺得亞歷山大王的首個模型如何？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Meta重組AI團隊后首個模型來了：不是最強、不再開源、可能夠用

DeepTech深科技 2026-04-09 10:19:10
0 跟貼 0
突然襲擊！剛剛，Meta超級智能團隊首個大模型來了

機器之心Pro 2026-04-09 09:23:53
0 跟貼 0

Sakana AI造了個數字生命「培養皿」，AI學會打架、結盟、搶地盤

機器之心Pro 2025-11-05 13:58:14
0 跟貼 0

重構跨域RL框架！理論驅動「雙重對齊」讓跨域遷移「質變」

機器之心Pro 2026-04-02 14:58:04
0 跟貼 0
不止動起來：SentiAvatar重新定義3D數字人動作生成范式

機器之心Pro 2026-04-08 11:23:10
0 跟貼 0

CVPR 2026｜1分鐘單圖變4D視頻！AI看圖直接腦補物理規律

機器之心Pro 2026-04-08 12:04:29
0 跟貼 0

AI數據獨角獸遭黑客攻擊，一周內吃了5場官司，Meta緊急暫停合作

智東西 2026-04-09 10:18:49
0 跟貼 0
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0

爆火GitHub！《生化危機》女主打造免費“AI記憶系統”

量子位 2026-04-09 13:09:00
2 跟貼 2
讓機器人學會手往哪兒伸、怎么操作，東大團隊給了新解法

機器之心Pro 2026-04-09 12:14:48
0 跟貼 0
205億沒談攏，黃仁勛的“盟友”出手了

智東西 2026-04-09 14:09:35
0 跟貼 0
幫普通人「馴服」Agent，這支硅谷初創團隊沖上了X全球熱搜

機器之心Pro 2026-04-09 14:13:36
0 跟貼 0
妹妹生孩子當天，妹夫撿回一個男嬰，兩個孩子就成了雙胞胎兄弟

懂八煉金室 2026-04-07 13:08:15
0 跟貼 0
退休金1萬2吃榴蓮被女兒質問，你配嗎？給她斷供后他們一家傻眼了

雪姐故事多 2026-04-08 09:08:16
0 跟貼 0
能力太強，Mythos被Anthropic“凍結”

虎嗅APP 2026-04-09 03:25:07
2 跟貼 2
霍爾木茲海峽已再次關閉

央視新聞客戶端 2026-04-09 05:32:07
24275 跟貼 24275
生成式推理再排序，可能會是LLM4RecSys的新突破口嗎？

機器之心Pro 2026-04-08 11:52:53
0 跟貼 0
蘇州CNC數控培訓新方法：RPEC實戰論助力畢業生即刻上崗！

隨性汽車 2026-04-09 01:00:35
0 跟貼 0
阿杜家事變回應：真相大揭秘

城市植愈所 2026-04-07 06:01:33
8 跟貼 8
美軍拯救2名F15飛行員全過程曝光！這次特朗普沒有吹牛

知識圈 2026-04-07 14:35:09
12989 跟貼 12989
FysicsWorld：填補全模態交互與物理感知評測的空白

機器之心Pro 2025-12-29 14:38:56
0 跟貼 0
動畫詳解：瘋狂的 F-15 救援任務

不一定有用的頻道 2026-04-08 07:57:38
6012 跟貼 6012
鄭麗文在洋山港區被記者包圍近1米8的身高"鶴立雞群"

全球速覽 2026-04-09 10:46:54
31 跟貼 31
僅憑一個細節就能破案，這推理能力太絕了，真相背后大有文章

尚悅電影 2026-04-09 11:00:40
1 跟貼 1
全程燒腦！這部高分推理韓綜值得一看！

韓影推薦MC 2026-04-08 12:55:13
1 跟貼 1
黑熊在道路上翻滾疑受傷？林草局：從山上滾落下來的，沒有受傷

星辰視頻 2026-04-06 15:41:39
3310 跟貼 3310
鄭麗文一行到上海美團參觀

頭條爆料007 2026-04-08 18:20:18
125 跟貼 125
騎車大叔不斷調整依然無法通過把將隨意停放擋路的電瓶車推倒

橙薪視頻 2026-04-06 17:07:58
0 跟貼 0
爬山遇到拾荒美女，簡直就是最美的巡山“清道夫”

美女歡樂多 2026-04-07 18:01:00
0 跟貼 0
中俄投下反對票！傅聰：不給使用武力開通行證

看看新聞Knews 2026-04-08 16:59:04
18805 跟貼 18805
上海消保委測評“二次元衣櫥”：四成消費者認為市場上盜版太多

澎湃新聞 2026-04-09 14:18:26
0 跟貼 0
鄭麗文聽到臺灣小伙娶了上海姑娘，笑得合不攏嘴

喜文多見01 2026-04-09 11:18:23
48 跟貼 48
女子回應“漢堡自助吃太多被拒絕接待”：不接受道歉，更不要賠償涉事店鋪去年被列為經營異常

紅星新聞 2026-04-08 19:52:16
4094 跟貼 4094
2000?問卷＋30款測評：揭開二次元衣櫥的秘密｜申評測

申消費 2026-04-09 10:58:45
0 跟貼 0
鄭麗文前往浙江參訪男保鏢抿嘴警惕女保鏢緊盯接待方

全球速覽 2026-04-09 10:02:03
29 跟貼 29
鄭麗文一行參觀上海洋山港接待人員神情輕松聊天

全球速覽 2026-04-09 10:12:35
3 跟貼 3
伊朗無人機航拍美軍被炸運輸機殘骸燒得一片漆黑

軍情透視 2026-04-05 18:30:31
472 跟貼 472
特朗普披露營救F-15飛行員內幕：帶傷攀爬峭壁、大量流血自行包扎

知識圈 2026-04-07 14:51:37
2405 跟貼 2405
英國74歲奶奶獨自游中國，各地網友接力搶著當導游，吉首大學學生：她在享受生活

瀟湘晨報 2026-04-08 18:04:41
1109 跟貼 1109
這取款機是純人工智能啊

長歌追劇 2026-04-08 08:20:53
1 跟貼 1

縣長提拔干部讓人看不懂，組織部長質疑，出事后才知真相

縣長提拔干部讓人看不懂，組織部長質疑，出事后才知真相

霧島夜話

2026-04-07 12:20:33

孫儷被吳慷仁害慘了??？

八卦瘋叔

2026-04-09 11:28:38

上海公園胖女壓倒櫻花樹后續：當事人被找到，已認錯賠償！

上海公園胖女壓倒櫻花樹后續：當事人被找到，已認錯賠償！

朗威談星座

2026-04-08 16:41:26

42歲江一燕官宣離婚，沒撕逼沒狗血，卻看哭無數人

42歲江一燕官宣離婚，沒撕逼沒狗血，卻看哭無數人

東方不敗然多多

2026-04-09 14:25:09

巴黎2-0利物浦，克瓦拉茨赫利亞一條龍，杜埃建功，利物浦0射正

巴黎2-0利物浦，克瓦拉茨赫利亞一條龍，杜埃建功，利物浦0射正

懂球帝

2026-04-09 04:58:22

伊朗停火聲明發布，全文令人淚目，伊朗要感謝的第一個居然是中國

伊朗?；鹇暶靼l布，全文令人淚目，伊朗要感謝的第一個居然是中國

諦聽骨語本尊

2026-04-09 14:35:34

四大巨星齊夸趙心童！熱度引發籍貫之爭，到底算哪里人？塵埃落定

四大巨星齊夸趙心童！熱度引發籍貫之爭，到底算哪里人？塵埃落定

觀察鑒娛

2026-04-08 09:36:52

不愧是HBO！奧妹這一脫，太拼了

不愧是HBO！奧妹這一脫，太拼了

來看美劇

2026-04-08 22:04:30

退休后，永遠不要在熟人面前，說以下6句話，切記切記

退休后，永遠不要在熟人面前，說以下6句話，切記切記

東林夕亭

2026-04-02 16:44:39

終于有了結果，曾醫生能保住醫院的工作，最應該感謝的三位貴人！

終于有了結果，曾醫生能保住醫院的工作，最應該感謝的三位貴人！

凌風的世界觀

2025-11-14 08:38:31

WTT戰報:連丟賽點，3對國乒一輪游！8強對陣出爐日本2席馬新各1席

WTT戰報:連丟賽點，3對國乒一輪游！8強對陣出爐日本2席馬新各1席

求球不落諦

2026-04-09 12:39:08

太解氣！杜蘭特霸氣回懟狄龍：我最差賽季，都比你巔峰強！

太解氣！杜蘭特霸氣回懟狄龍：我最差賽季，都比你巔峰強！

田先生籃球

2026-04-08 16:40:24

林彪提出接任北京軍區司令員人選時，毛主席反問：是四野的人吧？

林彪提出接任北京軍區司令員人選時，毛主席反問：是四野的人吧？

歷史龍元閣

2026-04-07 16:40:07

陳光標又鬧笑話了，火速刪掉博文！

陳光標又鬧笑話了，火速刪掉博文！

蔥哥說

2026-04-08 13:12:40

瓦大師爆掉意二哥，TME與阿卡爭八強，小豐戰貝雷，奧胖勝菲一姐

瓦大師爆掉意二哥，TME與阿卡爭八強，小豐戰貝雷，奧胖勝菲一姐

網球之家

2026-04-09 12:52:20

內娛女神劉詩詩驚艷蛻變？飽滿身姿暗藏極致女人味，這身材太絕?

內娛女神劉詩詩驚艷蛻變？飽滿身姿暗藏極致女人味，這身材太絕?

娛樂領航家

2026-03-10 22:00:04

浙江隊官方：米特里策損害俱樂部和聯賽的形象，隊內罰款6萬歐元

浙江隊官方：米特里策損害俱樂部和聯賽的形象，隊內罰款6萬歐元

懂球帝

2026-04-08 23:05:08

黃圣依承認戀情，拜拜了楊子。

美芽

2026-04-07 18:35:39

北京挖出大太監李蓮英之墓，開棺后，考古人員被嚇得渾身發抖

北京挖出大太監李蓮英之墓，開棺后，考古人員被嚇得渾身發抖

歷史人文2

2026-04-05 11:30:03

做藝人沒有藝德！在上海被抓捕的 4 位明星，你們知道都有誰嗎？

做藝人沒有藝德！在上海被抓捕的 4 位明星，你們知道都有誰嗎？

她時尚丫

2026-02-17 21:56:13

追蹤人工智能動態

12447文章數 176447關注度

往期回顧全部

科技要聞

Meta凌晨首發閉源大模型扎克伯格又行了？

頭條要聞

陳麗華告別儀式舉辦馬德華：遲重瑞心里很難過

頭條要聞

陳麗華告別儀式舉辦馬德華：遲重瑞心里很難過

體育要聞

8萬人面前心臟驟停現在他還站在球場上

娛樂要聞

金莎官宣結婚與老公孫丞瀟相差18歲

財經要聞

談判基礎已被破壞！霍爾木茲海峽關閉

汽車要聞

8155芯片+L2智駕瑞虎5運動版上市置換補貼價6.79萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

親子

本地

時尚

軍事航空

藝術要聞

龐茂琨 2026油畫寫生新作

親子要聞

以人類目前的意志力還不足以抵抗這種萌物

本地新聞

建水Color Walk | 古城慢調，掉進春天的調色盤里

ED網紅病，正在掏空年輕女性

軍事要聞

黎真主黨發射火箭彈回應以違反?；饏f議

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tfoot id="02www"><noscript id="02www"></noscript></tfoot>

<tr id="02www"></tr>