文 | 超前實驗室,作者|青蘋吹果
時隔一年,鈕祜祿·扎,強勢歸來!
Meta全新大模型Muse Spark正式上線,內部代號Avocado。
![]()
這個“牛油果”,來頭可不小。
TA不僅是Meta超級智能實驗室(MSL)成立9個月以來的首個成果,更是扎克伯格在經歷Llama 4慘烈翻車后,親手砸爛原有攤子、豪擲逾140億美金進行組織與戰略大洗牌之后,遞呈市場的第一張答卷。
更令人意外的是策略上的徹底轉向。那個曾高喊“開源對抗閉源”的Meta,這次直接給Muse Spark貼上了“閉源”標簽,連API都暫時只向少數指定合作伙伴開放預覽。
這讓我想起2024年那場沸沸揚揚的“開源與閉源”之爭,當時李彥宏大跳預言家,一口咬定開源其實是一種智商稅。“當你理性地去想,大模型能夠帶來什么價值,以什么樣的成本帶來價值的時候,就會發現,你永遠應該選擇閉源模型。閉源模型一定比開源模型更強大,推理成本更低。”
隨后幾年,開源生態蓬勃發展,社區熱情高漲。不少人以“開源勝利”為由,調侃李彥宏“判斷失誤”“被時代打臉”。一時間,閉源似乎成了保守與封閉的代名詞。
不過,風水輪流轉,時代和老扎一起,再一次追上了老李。
消息一出,資本市場也瞬間做出了最誠實的反應。
周三當天,Meta的股價像坐了火箭,盤中一度漲超10%,最終以超過6%的漲幅收盤,總市值穩穩站在1.55萬億美元的高位。
![]()
為什么一款模型發布能有如此巨大的能量?
懂行的人一眼就看出,Muse Spark背后藏著的,是Mate破釜沉舟的自我革命。
全部推翻! 在“廢墟”中重建高樓
要理解今天這款模型的戰略意義,先要知道它誕生于怎樣的一地雞毛之中。
去年春天,被寄予厚望的Llama 4發布后,很快遭遇了嚴重的信譽危機。
社區質疑聲不斷,隨后更是有爆料直指Meta在基準測試中動了手腳,拿著針對特定任務微調的“特供版”去刷榜,而公開給普通用戶的版本表現完全是另一回事。
拿精修圖相親,結果見面發現是“照騙”。
這件事對Meta AI品牌的傷害是致命的,甚至圖靈獎得主、Meta前首席科學家Yann LeCun在離職后也親口承認,Llama 4的測試結果“確實被修飾了一點”。
這件事徹底點燃了扎克伯格的怒火。
據外媒報道,他“對所有相關人員失去了信心”,隨后直接架空了整個生成式AI團隊,大批人馬離開。
這不僅僅是某個模型的失敗,更意味著過去那條從模型架構到研發流程,從開源路線到組織文化的路,可能都走不通了。
扎克伯格面臨的選擇很殘酷,要么繼續修修補補,要么全部推翻,在廢墟上重建。
他選了后者,而且干得非常徹底。
2025年夏天,扎克伯格做出了一筆震驚硅谷的交易,以高達143億美元的天價拿下數據標注巨頭Scale AI 49%的無投票權股份。
但更關鍵的是這筆交易的核心,時年不到30歲的華裔創始人Alexandr Wang(亞歷山大·王)被直接請進Meta,出任首席AI官,統管全新組建的Meta超級智能實驗室(MSL)。
這個年輕人什么來頭?MIT輟學、19歲創立Scale AI、26歲就躋身億萬富豪行列。
扎克伯格對他的評價是:“同輩創業者中最杰出的一位,深刻理解超級智能的歷史重要性”。
而這位年輕舵手上任后的第一把火,就是燒向舊體系,從OpenAI、谷歌DeepMind、Anthropic等競爭對手那里,以天價薪酬挖來了一整支“復仇者聯盟”。
翻看MSL首批11人名單,你會驚訝地發現,7位核心研究員都是華人背景。
浙大校友畢樹超(GPT-4o語音模式與o4-mini共同創建者)、清華校友趙晟佳(ChatGPT到o3的核心成員)、中科大校友于佳慧(前OpenAI感知團隊負責人)……再加上思維鏈提出者Jason Wei、擴散模型核心人物宋飏等業內頂尖高手。
這支被戲稱為“億元天團”的隊伍,目標只有一個:從零開始,重寫Meta的AI命運。
更令人意外的是策略上的徹底轉向。那個曾高喊“開源對抗閉源”的Meta,這次直接給Muse Spark貼上了“閉源”標簽,連API都暫時只向少數指定合作伙伴開放預覽。
很明顯,扎克伯格急了,他不求名聲了,只求能拿出一款真正能打、能收回成本的頂尖產品。
這筆賬他算得很清楚:反正2026年光AI相關的資本支出就要燒掉1150億到1350億美元,這次,必須確保每一分錢都砸在刀刃上。
偏科的「視覺天才」
砸了這么多錢,挖了這么多大牛,交出的Muse Spark到底成色如何?
Meta這次表現得格外老實,不再像Llama 4時代那樣大肆鼓吹“遙遙領先”,反而在官方博客里坦率地列出了一張優缺點分明的成績單。
這種老實人的態度,反倒讓人覺得,這回怕是真的有點東西了。
![]()
先看讓Meta揚眉吐氣的長板。
在醫療和視覺多模態這塊,Muse Spark簡直是“開掛”般的存在。
在極高難度的醫學開放式問答評測HealthBench Hard中,Muse Spark直接干到了42.8分,而隔壁GPT-5.4只有40.1分,Gemini 3.1 Pro更是可憐的20.6分,直接被拉開兩到三倍的差距。
憑什么這么強?
Meta拉著超過1000名專業醫生合作整理訓練數據,等于給模型配備了一個龐大的頂級專家顧問團做特訓。
別人家AI還在看百度百科,Muse Spark已經把協和專家的會診記錄背下來了。
這還沒完,在科研論文圖表的深度理解測試(CharXiv Reasoning)中,Muse Spark以86.4的高分力壓GPT-5.4的82.8和Gemini 3.1 Pro的80.2,穩坐頭把交椅。
你隨便甩給它一張復雜的醫學影像或者科學圖表,它都能像資深研究員一樣給你掰扯得明明白白。
更讓人心動的是它的應用場景。官方放出的案例里,只要對著食物拍張照片,Muse Spark就能分析出所有食物的分別的卡路里。
吃炸雞前拍一下熱量,從開心地吃變成了心驚膽戰地吃......
![]()
還能識別出你的瑜伽動作,指出正在發力的肌群并糾正姿態。
請健身私教的錢這不就省下來了!
![]()
甚至連咖啡機它都會用!
![]()
我都不敢想,Muse Spark要是應用在AI眼鏡上會有多爽......
然而,上帝打開一扇門,往往也會關上一扇窗。在純邏輯推理和代碼編程這塊,Muse Spark的表現就沒那么“神”了。
在ARC AGI 2抽象推理測試中,它僅拿到42.5分,被Gemini 3.1 Pro(76.5分)和GPT-5.4(76.1分)甩開了一個巨大的身位。在軟件工程實測(SWE-bench Pro)中,它的通過率(52.4%)也略遜于GPT-5.4的57.7%。
簡單來說,Muse Spark就像個嚴重“偏科”的天才少年,做數學奧賽卷子(編程推理)有點吃力,但給醫學博士當答辯評委(視覺醫療)綽綽有余。
這種鮮明的性格特征,也讓外界看懂了Meta的新打法。
不追求面面俱到的“六邊形戰士”,而是先在自己有絕對優勢的垂直領域扎下根來。
邏輯不夠,眼睛來湊,先幫大家把現實世界里的麻煩事兒解決了再說。
AI學會壓縮思維, 才是真正的降維打擊
而拋開那些花里胡哨的跑分,Muse Spark背后真正可怕的地方,其實藏在Meta公布的一項技術數據里。
Meta官方博客明確指出:在新重建的技術棧下,Muse Spark達到與上一代Llama 4 Maverick同等性能水平所需的計算量,減少了超過一個數量級。這可是10倍以上的效率躍升。
![]()
不是優化了百分之二三十,而是直接砍掉了一個零。
在算力就是金錢的AI軍備競賽中,這幾乎等于用對手造一發子彈的預算造出了一顆原子彈。
怎么做到的?這就要提到MSL團隊在這次發布中反復強調的一項核心技術——「思維壓縮」(Thought Compression)。
聽起來很玄乎,其實原理很巧妙,在強化學習訓練階段,團隊引入了一種“思考時間懲罰”機制。
簡單說就是,模型回答問題時如果啰里啰嗦想太久,就給它“扣分”。在這種壓力下,模型被迫進化,學會了用更少的推理token、更短的邏輯鏈條,去解決同樣的復雜問題,而且準確率不降反升。
這就好比一個經驗豐富的外科醫生和一個還在翻教科書的新手,前者在腦子里過一遍就知道怎么下刀,后者得把整本教材默念一遍才敢動手。
而MSL團隊還發現了一個更有趣的“相變”現象,模型在學會精簡思考后,又會在此基礎上適度延長推理,實現效率和性能的動態平衡。
這是一種更高階的智能,不僅知道答案,還知道“怎么最省力地找到答案”。
配合這個理念,Muse Spark還推出了多Agent并行推理的「沉思模式」(Contemplating Mode)。
![]()
傳統的推理模式是讓一個模型在那悶頭使勁想(延遲高),而Muse Spark是同時拉起好幾個子智能體,各自處理不同維度的信息,最后匯總。
在相近的響應時間內,這種“群毆”式的打法讓它在Humanity‘s Last Exam這類地獄難度的評測中,跑出了58%的好成績,直接把GPT-5.4 Pro(43.9%)和Gemini Deep Think(48.4%)按在地上摩擦。
扎克伯格在Facebook上發帖介紹時說,這不僅僅是一款智能助手,更是“在個人超級智能相關領域表現尤為突出”的新物種。
這句話的潛臺詞是:Meta不再滿足于做一個對話機器人,而是要造一個真正能幫你看病、做飯、規劃生活的“全能外掛”。而且,他們正在用一套更聰明、更省錢的方式去實現它。
說實話,Muse Spark算不上一個完美無缺的“六邊形戰士”,它的編程能力還有待打磨,抽象推理也與頂流存在差距。
但TA用9個月的時間,硬生生把Meta從Llama 4的輿論泥潭里拽了出來,重新回到了能與GPT-5.4、Gemini 3.1 Pro同場競技的第一梯隊。
對于扎克伯格和這支“華人天團”來說,Muse Spark更像是一個宣言。
那個靠開源攢口碑的Meta已經翻篇了,而一個更務實、更有技術野心的新Meta,才剛剛開始熱身。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.