![]()
在沉寂了將近一年之后,Meta終于端出了一道讓行業側目的大菜。
4月8日,Meta正式發布旗下最新旗艦AI模型 Muse Spark,將其定性為“從零開始的全面改造”——這是Meta全新成立的超級智能實驗室(Meta Superintelligence Labs,下稱MSL)對外發布的首個公開模型,也是扎克伯格為重奪AI桌上一席之地而打出的最重要一張牌。
Muse Spark的誕生,是Meta對自身AI戰略一次徹底的自我否定與重構。
過去兩年,Meta在AI賽道上的形象相當尷尬:Llama系列雖然憑借開源策略在生態圈積累了口碑,但無論是產品完成度還是模型性能,都被OpenAI的ChatGPT、Anthropic的Claude遠遠甩在身后。扎克伯格曾公開承認自己對Meta AI進度不滿意,并下定決心啟動一場全面革新。
過去9個月里,Meta重建了整個AI技術棧,包括訓練基礎設施、推理架構和數據策略。Muse Spark不是在舊基礎上修修補補,而是真正意義上的“新生”。用Meta自己的話說,這是“我們擴展階梯的第一步”——言下之意,Muse系列之后還有更多。
新大腦,新團隊
重建的不只是技術,還有人。
去年,Meta宣布成立超級智能實驗室,并以143億美元投資入股AI數據公司Scale AI,獲得49%股權,并任命Scale AI創始人Alexandr Wang 擔任Meta首席AI官,主導這場重建工程。與此同時,Meta從OpenAI、Anthropic、Google大批挖角頂尖研究人員,以業界罕見的薪酬體系重組了AI核心團隊。
這一系列動作的信號再明確不過:扎克伯格要玩真的了。
從獨立第三方評測機構Artificial Analysis的數據來看,Muse Spark在綜合智力指數(Intelligence Index)上得分52,全球排名前五,僅次于谷歌Gemini 3.1 Pro Preview、OpenAI GPT-5.4和Anthropic Claude Opus 4.6,大幅超越Meta此前最強模型Llama 4 Maverick(18分)。
具體能力維度上:
- 視覺理解(MMMU-Pro):得分80.5%,全球第二,僅次于Gemini 3.1 Pro Preview的82.4%;
- 推理與指令遵循(HLE評估):得分39.9%,位居第三;
- 科學推理(CritPT物理研究題):得分11%,超越Claude 4.6 Sonnet(3%)和Gemini 3 Flash(9%);
- “人類終極考試”(Humanity's Last Exam):借助外部工具時達到58.4分的高水準。
值得關注的是,Muse Spark在達到頂尖性能的同時,Token消耗效率極高,僅使用約5800萬輸出Token,與Gemini 3.1 Pro Preview相當,遠低于Claude Opus 4.6的1.57億和GPT-5.4的1.2億。效率與性能兼顧,是Muse Spark在架構層面的重要突破。
Meta自己也坦承,在“長視野代理系統和編碼工作流”領域仍存在一定差距,這也是未來需要持續補強的方向。
兩種模式:快與深的平衡
Muse Spark上線后,Meta AI應用同步推出兩種工作模式:
- 即時模式(Instant):針對日常對話和簡單問題,追求快速響應;
- 沉思模式(Contemplating):面對復雜任務時啟動,可協調多個AI子智能體并行推理,在保持相近延遲的同時大幅提升輸出質量。
這種“多智能體并行”的架構設計頗具新意。以旅行規劃為例,模型可以同時完成行程規劃、目的地對比、活動篩選等多個子任務,最終整合輸出一份完整方案,效率和精度均遠超傳統單鏈式推理。
Muse Spark是一個原生多模態模型,支持文本、圖像等多種輸入形式,具備真正的跨模態理解與交互能力。
在應用場景上,Meta著重布局了兩個垂直方向:
健康領域:Meta專門與超過1000名醫生合作優化訓練數據,使模型在處理醫療建議類問題時具備更高的專業性與安全性。這一舉措信號明顯——Meta正在將AI定位為“個人健康助手”,而非單純的信息檢索工具。
視覺STEM(科學、技術、工程、數學):模型在處理視覺化科學與工程問題上表現出色,用戶可以通過拍照或描述來排查家用電器故障、生成交互小游戲,甚至實時理解技術圖紙。
此外,Muse Spark還可接入用戶在Instagram、Facebook、Threads等平臺分享的內容,提供個性化推薦,并在Meta AI眼鏡上實現更強的環境感知能力——這是Meta“具身AI”戰略的重要組成部分。
這或許是Muse Spark發布中最微妙、也最值得關注的一個信號。
Meta曾是開源AI生態的旗手,Llama系列開放權重下載,催生了全球數以萬計的開發者應用。然而,Muse Spark首發時選擇了閉源——僅通過meta.ai和Meta AI應用提供,API僅向部分合作伙伴開放私有預覽,普通開發者無法直接調用。
扎克伯格表示,未來仍計劃發布“越來越先進的開源模型”,但Muse Spark本身暫不開源。
這一轉變意味著什么?一種解讀是:Meta已意識到,在前沿模型的軍備競賽中,“開放”固然可以擴大生態,但也意味著提前曝光核心能力、讓競爭對手借鑒領先技術。在真正建立性能優勢之前,Meta選擇先“守住底牌”。另一種解讀則更為商業:Meta需要通過閉源API變現,為每年數百億美元的AI投入找到可持續的商業回報。
兩種邏輯并不矛盾,但都指向同一個方向:Meta正在從理想主義的開源布道者,向務實的AI商業玩家悄然轉型。
“個人超級智能”:扎克伯格想要的,遠不止一個聊天機器人
在發布聲明中,扎克伯格將Muse Spark定位為通往“個人超級智能”愿景的第一步。這個詞匯的選用絕非隨意——它對應的是Sam Altman口中“AGI”概念的Meta版敘事,暗示Meta的野心在于打造一個真正能夠替代人完成任務的AI代理(Agent),而非只是一個回答問題的聊天工具。
按照這一戰略路線,Meta未來的AI產品將嵌入用戶的全平臺數字生活:Instagram的內容推薦、WhatsApp的日程管理、AR眼鏡的實時視覺輔助……Meta擁有全球最龐大的社交用戶基礎,這是OpenAI和Anthropic無法復制的獨特資產。
當然,這也伴隨著隱私風險。目前,使用Muse Spark需要通過Facebook或Instagram賬號登錄,Meta的慣常做法是利用公開用戶數據進行模型訓練。隨著AI深度融合個人社交數據,用戶隱私邊界如何界定,將是監管機構和公眾長期關注的議題。
Muse Spark的意義,不僅僅在于一個模型的性能數字。
它更深層的含義是:Meta終于重新站上了前沿AI的牌桌。在過去一年里,OpenAI憑借GPT-5系列、Anthropic憑借Claude 4系列、谷歌憑借Gemini 3系列,分別鞏固了各自的行業地位。而Meta一直以一個“追趕者”的姿態出現,甚至一度被調侃為“AI時代的局外人”。
Muse Spark改變了這一敘事。52分的綜合評分,視覺理解全球第二,Token效率業界領先——這些數字證明,經過9個月的徹底重建,Meta已經具備了與頂尖AI公司正面交鋒的技術實力。
更重要的是,Meta有其獨有的護城河:35.8億日活用戶、跨平臺的社交數據網絡、AR眼鏡等硬件生態,以及在消費級AI產品上的多年沉淀。一旦模型能力與平臺生態真正融合,Meta在AI應用層的爆發力,可能遠超今天市場的預期。
這場AI翻身仗,才剛剛開始。(本文首發鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 秦聰慧)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.