337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

Meta重組AI團隊后首個模型來了:不是最強、不再開源、可能夠用

0
分享至

當地時間 4 月 8 日,Meta 終于發布了 Muse Spark,九個月來第一個新模型,也是 Meta 超級智能實驗室(MSL)成立以來的第一個產品。消息公布后 Meta 股價盤中漲超 10%。扎克伯格在 Threads 上說,這是一個“世界級助手”。但一位 Meta 高管也比較坦誠地向媒體表示:Muse Spark 并不代表新的技術前沿,只是在部分任務上與領先模型“有競爭力”。

不差,但也沒好到讓人直呼牛 X。對 Meta 來說,更重要的信號可能是:它終于又能坐回牌桌了。

經歷一系列大動蕩之后,Muse Spark 是 Meta AI 大重組后的第一個產物,Alexandr Wang 在 X 上說:我們從零開始重建了整個 AI 技術棧。

Meta 給出的一個關鍵數字是:Muse Spark 達到 Llama 4 Maverick 同等性能所需的計算量減少了 10 倍以上。這說明過去九個月不只是在舊體系上縫補,而是確實換了一套引擎。在預訓練階段的 scaling law 對比中,Muse Spark 的計算效率也優于 DeepSeek-V3.1 和 Kimi-K2 的基座模型。

在 Benchmark 分數上 Meta 這次雖然沒有作弊,但還是耍了個小花招。對比表格中只有 Muse Spark 一列的數字用藍色高亮,其余模型一律白色,視覺上很容易讓人覺得 Muse Spark 全面領先。


圖丨基準測試成果(來源:Meta)

重新按每行最高分標綠、最低分標紅之后再看,Muse Spark 的觀感會差很多。在多模態和健康類任務上它確實領先,但在編程、抽象推理和 agentic 任務這些當下最熱門的應用場景中,它全面落后于 Gemini 和 GPT-5.4。

具體來看。ARC AGI 2(抽象推理)上 Muse Spark 拿到 42.5 分,Gemini 3.1 Pro 是 76.5,GPT-5.4 是 76.1,差了近一倍。LiveCodeBench Pro(編程競賽)80 對 GPT-5.4 的 87.5;Terminal-Bench 2.0(終端編程)59 對 75.1;GDPval-AA Elo(辦公任務)1444 對 GPT-5.4 的 1672 和 Opus 4.6 的 1606。Meta 自己也在博客中承認“在長時序 agentic 系統和編程工作流方面仍有差距”。


圖丨重新標準后的基準測試結果(來源:X)

第三方評測機構 Artificial Analysis 給 Muse Spark 的綜合智能指數打了 52 分,排在 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6 之后,位列第四。在 Humanity's Last Exam(無工具)上,Artificial Analysis 追蹤到的成績是 39.9%,低于 Meta 自報的 42.8%,也低于 Gemini 3.1 Pro 的 44.7%。

博主 Ritesh Khanna 用同一組 prompt 對五個前沿模型做了零重試實測。結論是:Muse Spark 在視覺理解和金融分析上排名第一,但代碼生成墊底。在生成雪花玻璃球的實測中,它寫出了技術上最漂亮的 Three.js 代碼,然后渲染出幾個黑糊糊的物體。


圖丨測試結果(來源:Ritesh Khanna)

Muse Spark 真正拉開差距的領域集中在兩個方向:多模態視覺理解和健康。

CharXiv Reasoning(圖表理解)上它以 86.4 分領先所有對手;ScreenSpot Pro(截圖定位)84.1 分,僅次于 GPT-5.4 的 85.4;HealthBench Hard(開放式健康問答)得分 42.8,是 Gemini 3.1 Pro(20.6)的兩倍多。Meta 說他們與超過 1000 名醫生合作策劃了健康領域的訓練數據。

這兩個方向恰好對應 Meta 的產品需求,理解用戶在 Instagram 上拍的食物照片、在 Ray-Ban 智能眼鏡里識別周圍物體、為 Meta AI 助手增加健康問答能力。

Muse Spark 的另一個推理模式“Contemplating”(沉思模式)通過多智能體并行推理來處理更難的任務,在 Humanity's Last Exam(含工具)上拿到 50.2 分,略高于 Gemini Deep Think 的 48.4 和 GPT-5.4 Pro 的 43.9。但物理奧賽(IPhO 2025 Theory)上 82.6 對 GPT-5.4 Pro 的 93.5,差距仍然明顯。

換句話說,Muse Spark 是一個為 Meta 自身產品場景高度定制的模型,不是一個通用前沿模型。從發布方式上也能看出來。

和 Llama 系列不同,Muse Spark 是閉源的。Meta 只向“精選合作伙伴”提供私有 API 預覽,普通開發者用不了。

它直接部署在 Meta AI 聊天助手中,未來幾周會擴展到 Facebook、Instagram、WhatsApp 和 Ray-Ban 眼鏡。Meta 還為它配套了一個“購物模式”,結合用戶在社交平臺上的興趣數據做個性化推薦。基本上是把 AI 能力直接接到廣告和電商的變現鏈路上。

沃頓商學院教授 Ethan Mollick 評論說,Muse Spark 最重要的意義在于 Meta 現在有了自己的前沿模型,可以用它從現有用戶基礎中提取更多價值。但他也說:沒有開源權重,就很難預判 Spark 的長期價值,因為此前的 Llama 之所以重要,主要是因為它開源。

Meta 過去三年靠 Llama 系列建立了開源 AI 領域最大的生態:累計下載量 12 億次,日均下載約 100 萬次,企業自部署 Llama 模型的成本比使用閉源 API 低 88%。但到 2025 年底,阿里的 Qwen 3.6 Plus 和 DeepSeek 等中國模型在 Hugging Face 上的下載占比已經達到 41%,美國只占 35%。Llama 4 的失利加速了侵蝕。Muse Spark 閉源發布,某種程度上是承認了現實:與其繼續做開源基礎設施供應商,不如先把自家產品的 AI 能力補上來。

Alexandr Wang 說未來會有開源版本。扎克伯格也承諾“將發布越來越先進的模型,包括新的開源模型”。但眼下的優先級很清楚:先產品,再生態。

Meta 今年的資本支出預算在 1150 億到 1350 億美元之間,幾乎是 2025 年的兩倍。Muse Spark 是這筆投資的第一個可見產出。它證明了 MSL 團隊能在九個月內從零搭出一套有效的技術棧,計算效率在快速提升,多模態和健康方向的差異化也初步成立。Gizmodo 的評價是:扎克伯格的百億美元投入,讓 Meta 從“徹底掉隊”升級到了“競爭陪跑”。

但它發布的前一天,Anthropic 公布了據說強大到只能限量開放的 Claude Mythos,智譜 AI 發布了在編程基準上領先的 GLM-5.1。扎克伯格承諾更大、更強的模型正在路上。問題是,其他對手也并不會停下來原地等 Meta。

參考資料:

https://ai.meta.com/blog/introducing-muse-spark-msl/

https://www.riteshkhanna.com/blog/muse-spark-arena

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
76項研究證明:6種堅果降血脂大比拼,第一名居然是它!每天吃10顆,降脂、補纖維、抗炎

76項研究證明:6種堅果降血脂大比拼,第一名居然是它!每天吃10顆,降脂、補纖維、抗炎

掌上腎醫
2026-04-19 16:19:00
沙溢當眾毆打李晨,被告上仲裁會:永遠不要輕易評價一個人

沙溢當眾毆打李晨,被告上仲裁會:永遠不要輕易評價一個人

圓夢的小老頭
2026-03-15 03:37:22
鴻蒙智行旗艦MPV智界V9內飾細節曝光,4月22日開啟預訂

鴻蒙智行旗艦MPV智界V9內飾細節曝光,4月22日開啟預訂

IT之家
2026-04-19 12:08:46
新澳門六合彩第109期,特,三中三,內幕推薦

新澳門六合彩第109期,特,三中三,內幕推薦

背包客的自我修養
2026-04-19 14:40:36
這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

這種飲料正在摧毀你的胰島細胞!很多糖尿病,都和這種飲料有關!

蜉蝣說
2026-01-29 14:46:50
英超瘋狂一夜:絕殺頻現,保級隊驚天逆轉

英超瘋狂一夜:絕殺頻現,保級隊驚天逆轉

余憁搞笑段子
2026-04-20 00:20:16
杜德偉憑《風林火山》“李文狄”一角 首奪金像獎最佳男配角 感謝梁家輝徹夜教戲

杜德偉憑《風林火山》“李文狄”一角 首奪金像獎最佳男配角 感謝梁家輝徹夜教戲

草莓解說體育
2026-04-20 01:23:13
北影節紅毯:高圓圓美的驚心動魄,被周冬雨嚇了一跳,高葉太敢穿

北影節紅毯:高圓圓美的驚心動魄,被周冬雨嚇了一跳,高葉太敢穿

糊咖娛樂
2026-04-17 11:24:40
140年來最強厄爾尼諾要出現了?氣溫將沖擊高溫極限!真的嗎?

140年來最強厄爾尼諾要出現了?氣溫將沖擊高溫極限!真的嗎?

史行途
2026-04-19 14:25:26
傻狍子找了長腿格格替身

傻狍子找了長腿格格替身

毒舌扒姨太
2026-04-18 22:40:31
淪為共享單車的女色虎

淪為共享單車的女色虎

深度報
2026-03-05 22:39:27
郵報:切爾西將高管薪酬提高了80%;恩佐、福法納等人或離隊

郵報:切爾西將高管薪酬提高了80%;恩佐、福法納等人或離隊

懂球帝
2026-04-19 07:37:08
26家企業涉醫藥商業賄賂案!知名藥企退市摘牌,17個中成藥被暫停掛網,金賽、樂普、綠葉亮了

26家企業涉醫藥商業賄賂案!知名藥企退市摘牌,17個中成藥被暫停掛網,金賽、樂普、綠葉亮了

新浪財經
2026-04-18 18:07:40
短短一年炎癥變癌癥?醫生提醒:患上5種炎癥不能拖,小心癌變

短短一年炎癥變癌癥?醫生提醒:患上5種炎癥不能拖,小心癌變

39健康網
2026-04-19 18:38:55
1949年,毛澤東去戲院看戲,指著一人說:你看,他真是一副奴才相

1949年,毛澤東去戲院看戲,指著一人說:你看,他真是一副奴才相

涼州辭
2026-04-18 15:50:03
潘粵明評價獲證實!董潔22年后與藍顏知己再牽手

潘粵明評價獲證實!董潔22年后與藍顏知己再牽手

獨舞獨舞
2026-01-18 06:37:17
遭公開控訴雙面人后,王陽被曝大瓜,才發現蔣欣當年決策有多高明

遭公開控訴雙面人后,王陽被曝大瓜,才發現蔣欣當年決策有多高明

阿褲趣聞君
2026-04-17 23:11:38
臺灣回歸新方案浮出水面:國民黨若同意,解放軍或無需動武

臺灣回歸新方案浮出水面:國民黨若同意,解放軍或無需動武

全球沸點直擊
2026-04-19 19:12:42
阿斯:皇馬去年12月就想換掉阿隆索,如今認為白白浪費一個月

阿斯:皇馬去年12月就想換掉阿隆索,如今認為白白浪費一個月

懂球帝
2026-04-19 04:48:55
全面反華?特朗普提名駐韓大使,關鍵時刻,韓國擬對華收33%關稅

全面反華?特朗普提名駐韓大使,關鍵時刻,韓國擬對華收33%關稅

軒逸阿II
2026-04-20 02:11:47
2026-04-20 03:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16598文章數 514891關注度
往期回顧 全部

科技要聞

50分26秒破人類紀錄!300臺機器人狂飆半馬

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內娛隔空掀桌第一人

財經要聞

華誼兄弟,8年虧光85億

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態度原創

旅游
教育
時尚
藝術
軍事航空

旅游要聞

北京投入2.2億元建成和田“三館一院”

教育要聞

655家單位、1.29萬個崗位,湖南用心幫大學生找工作

裝修“精神角落”,就是這么上癮

藝術要聞

超模施特洛耶克寫真曝光,簡直美到窒息,別錯過!

軍事要聞

伊朗逼退美掃雷艇:美方求給15分鐘撤退

無障礙瀏覽 進入關懷版