337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

汪滔的第一款大模型,讓Meta終于重新上桌了

0
分享至



從汪滔(Alexandr Wang)加入Meta算起,已經過去大約十個月了,世界眼瞅著就要從一個夏天走到另一個夏天,Meta的“牛油果”終于熟了。

當地時間4月8日,Meta官宣發布Muse系列的第一款模型Spark。這也是Meta吸納汪滔并建立“超級智能實驗室(MSL)”之后端上來的第一盤菜。

汪滔在X上連發數條消息介紹新模型,表示:“九個月前,我們從零開始重建了人工智能技術棧,包括全新的基礎設施、架構和數據管道。Muse Spark 正是這項工作的成果。”

就連之前傳聞與汪滔不和的Meta前首席科學家楊立昆(Yann LeCun)都趕來恭喜,氣氛一片祥和。



Meta官方強調,Spark的設計初衷是“小巧快速”,用這樣一個模型打頭陣,而不是“憋大招”直接發布碾壓態勢的模型,Meta也清楚時間不等人。

目前來看這一招奏效了,Meta的股價在當日一度上漲約9%。

01

新模型Muse Spark

首先,讓我們來看看Meta發了個什么模型。

新模型名叫Muse Spark,其中Muse是模型系列的名稱。這個名字也挺有意思的,Muse即“繆斯”,Spark是“火花”。

Meta表示,Muse Spark是Meta迄今為止功能最強大的模型。它目前為Meta AI應用和網站提供支持,并將于未來幾周內陸續登陸WhatsApp、Instagram、Facebook、Messenger和AI眼鏡。Meta還將通過API向部分合作伙伴提供該模型的私有預覽版。

很明顯,Meta想要充分發揮自己的平臺優勢,明確表示Muse Spark是專為Meta的產品而打造的。

它將為Meta AI提供更智能、更快速的支持,并隨著時間的推移解鎖新功能,這些功能可以引用用戶在Instagram、Facebook和Threads上分享的推薦內容和信息。

“我們正朝著個人超級智能的目標邁進:打造一款能夠隨時隨地幫助任何人處理他們最關心之事的智能助手。”

Muse Spark的設計初衷是小巧快速,卻足以應對科學、數學和健康領域的復雜問題,其核心是一個原生多模態推理模型。

與以往將視覺和文本“拼接”在一起的版本不同,Muse Spark從底層架構開始重建,將視覺信息整合到其內部邏輯中。這種架構轉變實現了“視覺思維鏈”,使模型能夠標注動態環境——例如識別復雜咖啡機的組件,或通過并排視頻分析糾正用戶的瑜伽姿勢。



然而,最重要的技術飛躍是新增的“思考”模式。

Meta聲稱,該功能協調多個子智能體并行推理,使Meta能夠與谷歌的Gemini Deep Think和OpenAI的GPT-5.4 Pro等極端推理模型相媲美。



單模型測試結果來看。

Meta的新模型Muse Spark在綜合智能指數上表現亮眼。它在Artificial Analysis Intelligence Index(一個涵蓋多維度基準的綜合智能評分)上拿到了52分,位列全球第4名。排在前面的分別是Gemini 3.1 Pro和GPT-5.4(均為約57分),以及Claude Opus 4.6(約53分)。

相比去年Llama 4 Maverick的僅18分,這已經是巨大的進步,顯示Meta在前沿模型上明顯追趕了回來。

具體強項和弱項:

. PhD級科學推理(GPQA Diamond):Muse Spark達到了89.5%的準確率,表現相當強勁,但仍略微落后于Gemini 3.1 Pro(94.3%)、GPT-5.4(92.8%)和Claude Opus 4.6(92.7%)。

. 圖表與視覺理解(CharXiv Reasoning,在Contemplating模式下):得分86.4,在這項多模態視覺推理任務上明顯優于競品——超過了Gemini 3.1 Pro(80.2)、GPT-5.4(82.8)和Claude Opus 4.6(65.3)。視覺理解和圖表推理是Muse Spark的突出優勢之一。

. 醫療硬推理(HealthBench Hard):得分42.8%,大幅領先所有主要競品,包括GPT-5.4(40.1%)、Gemini 3.1 Pro(20.6%)和Claude Opus 4.6(14.8%)。Meta表示,這得益于他們與超過1000名醫生合作進行的針對性訓練,醫療相關能力是它的亮點。

. 軟件工程與編碼(SWE-Bench Verified):得分77.4%,落后于Claude Opus 4.6(80.8%)和Gemini 3.1 Pro(80.6%)。Meta自己也坦承,在長時程多步自主任務(agentic tasks)和復雜編碼工作流上還有差距,需要繼續投入。

. 多模態多學科理解(MMMU Pro):得分約80.4–80.5%,僅次于Gemini 3.1 Pro(83.9%),在視覺多模態任務中排名第二。

總體來看,Muse Spark在視覺多模態推理、醫療領域和高效推理上表現突出,尤其適合Meta自己的社交、內容和健康生態;但在純編碼和長鏈條自主任務上仍有追趕空間。

02

推遲數次的“牛油果”

在X上,發生了一個有趣的小插曲。

作為Meta如今的AI掌舵手,汪滔(Alexandr Wang)在X上咣咣發布消息宣傳新模型。

這個時候,有人指出,Meta給出的benchmark圖表太混淆視聽,“簡直是犯罪”。在這張圖表中,Muse Spark的分數排在第一列并且全部標成突出高亮色,乍一看,感覺是全面領先,但是細看便知其實有些分數是較低的。





在圖表上玩花樣,其實并不新鮮,OpenAI此前已經多次因此受到指責。

有意思的是,汪滔這次選擇了立刻“滑跪”,回復該質疑:

“抱歉,我們并非有意暗示我們的得分最高。恰恰相反,大多數評估結果表明,我們的模型還有很多需要改進的地方。我們不會再犯同樣的錯誤。”



不難看出,Meta也并非要讓Muse Spark達到全面碾壓之勢,而是要回到AI的競爭行列當中。

從種種跡象來看,Muse系列應該就是Meta此前內部代號“牛油果(Avocado)”的項目。

牛油果已經跳票太久,Meta如今采取了“先小后大”的策略。Meta在官方博文中強調,Spark主打快速小巧,這只是個開始:

“我們的模型正在按預期發展。Muse Spark是我們發展歷程中的一個早期數據點,我們正在開發更大規模的模型。”

這和AI行業(尤其是頭部玩家)習慣于“炸場”“驚世駭俗”的節奏不同,但是Meta確實也沒時間慢慢來了。

去年初,Meta發布Llama 4系列后,模型表現未達預期(尤其是Behemoth大模型性能提升不足),隨后暫停了Llama系列的進一步開源研發。

到了去年夏天,Meta斥資143億美元投資Scale AI(持股49%),并直接挖來Scale AI創始人兼CEO、28歲的汪滔(Alexandr Wang)擔任首席AI官,正式成立Meta Superintelligence Labs(MSL)。

同時Meta展開瘋狂挖角,從OpenAI、Google等公司高薪招募數十名頂尖研究員,部分offer達到數百萬至上億美元。

成本方面,Meta2025年全年AI相關資本支出達722.2億美元;2026年1月財報指引顯示,這一數字將大幅提升至1150億—1350億美元,幾乎翻倍,主要用于MSL的模型訓練和數據中心擴建。

過去這十個月的時間里,Meta以及扎克伯格、Meta的AI一把手汪滔身上,都壓力山大。人們迫切地想看到汪滔加入、Meta重組之后,究竟會端上來一盤什么菜。

至少從市場的第一時間反饋來看,Meta放棄“憋大招”轉而先上小菜的策略是奏效的,Meta股價當日一度大漲近9%,創下自今年1月以來最大單日漲幅。截至收盤,Meta收漲6.5%。

一個值得注意的信息是,過去外界一直認為“牛油果”將完全轉向閉源,但Meta這次卻沒有把話說死。未來,Meta可能走開源與閉源并行的混合策略,將旗艦模型和獨家技術保留在內部的同時保持新鮮模型對廣泛開發者群體的開源可用性。

Meta總算把“牛油果”端上桌了,但這還遠遠不是終點。對汪滔和扎克伯格來說,Muse Spark更像是一聲發令槍,未來如何,還要看“越來越強”的承諾能不能兌現。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
以為被罰看大門就老實了,結果是真香!網友:這哪是打壓 分明是貴人

以為被罰看大門就老實了,結果是真香!網友:這哪是打壓 分明是貴人

侃故事的阿慶
2026-04-10 18:05:08
兩段婚姻都娶普通人,三婚娶名導前妻,知名前國腳,如今活成這樣

兩段婚姻都娶普通人,三婚娶名導前妻,知名前國腳,如今活成這樣

削桐作琴
2026-04-10 18:36:31
“兩岸統一”突破點不在馬英九,也不在國民黨,可能在這個人身上

“兩岸統一”突破點不在馬英九,也不在國民黨,可能在這個人身上

今夜繁星墜落
2026-03-05 06:56:40
過分諂媚會顯得特別真誠!網友:看完發現,我兩千的工資一點不冤

過分諂媚會顯得特別真誠!網友:看完發現,我兩千的工資一點不冤

夜深愛雜談
2026-04-08 17:06:30
加納喬后悔離開曼聯,稱仍熱愛紅魔!在切爾西才半年已瀕臨被清洗

加納喬后悔離開曼聯,稱仍熱愛紅魔!在切爾西才半年已瀕臨被清洗

羅米的曼聯博客
2026-04-11 10:53:42
0-3!太原賽國乒崩盤:連輸日本5場,單局2-11,黃友政爆冷遭逆轉

0-3!太原賽國乒崩盤:連輸日本5場,單局2-11,黃友政爆冷遭逆轉

侃球熊弟
2026-04-10 14:20:48
深夜72股發年報,46股業績暴雷,23股業績大幅增長,別踩雷了

深夜72股發年報,46股業績暴雷,23股業績大幅增長,別踩雷了

風風順
2026-04-11 02:00:03
鄭麗文一行在上海參訪 點贊大陸經濟活力與城市魅力

鄭麗文一行在上海參訪 點贊大陸經濟活力與城市魅力

新華社
2026-04-09 15:36:11
西交大突然換帥!新書記來自中央財經大學,履歷太特殊

西交大突然換帥!新書記來自中央財經大學,履歷太特殊

Delete丨CC
2026-04-10 19:21:08
11.2萬噸航母將登場,或搭載75架隱身戰機,俄:至少領先世界20年

11.2萬噸航母將登場,或搭載75架隱身戰機,俄:至少領先世界20年

聞識
2026-04-10 16:52:47
我退休金9200花680買羊絨衫,兒媳當眾撕爛,我斷絕關系回老家

我退休金9200花680買羊絨衫,兒媳當眾撕爛,我斷絕關系回老家

飛云如水
2025-10-03 14:48:04
廣東穩住前4,杜鋒深夜發聲,徐杰登上雜志封面,杜潤旺賽季高光

廣東穩住前4,杜鋒深夜發聲,徐杰登上雜志封面,杜潤旺賽季高光

萌蘭聊個球
2026-04-11 12:08:05
加拿大游客回國直言:在中國生活,每天像在看科幻片

加拿大游客回國直言:在中國生活,每天像在看科幻片

明天見灌裝冰塊
2026-03-15 07:08:20
張馨予太豐滿,穿白襯衫都兜不住好身材,我感慨軍人老公眼光真好

張馨予太豐滿,穿白襯衫都兜不住好身材,我感慨軍人老公眼光真好

蓓小西
2026-04-11 09:28:58
英國泛濫 6000 萬只,英國人殺一只獎勵英鎊,中國人吃一只卻坐牢

英國泛濫 6000 萬只,英國人殺一只獎勵英鎊,中國人吃一只卻坐牢

嘆知
2026-04-11 10:00:15
上海德比還沒開打,兩位主帥就隔空大戰!特謝拉的情緒誰說了算?

上海德比還沒開打,兩位主帥就隔空大戰!特謝拉的情緒誰說了算?

刀鋒體育
2026-04-11 12:14:56
馬克西32+8喬治21分 76人賽季橫掃步行者

馬克西32+8喬治21分 76人賽季橫掃步行者

北青網-北京青年報
2026-04-11 12:48:37
落難的鳳凰不如雞,多位明星無戲可拍,淪落到給景區打工,太心酸

落難的鳳凰不如雞,多位明星無戲可拍,淪落到給景區打工,太心酸

秋姐居
2026-03-29 22:00:48
毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

毛主席從不批評劉伯承和徐向前,一個是不忍批評,另一個無需批評

鶴羽說個事
2026-04-08 22:21:11
不要再向以色列提供一架戰斗機!

不要再向以色列提供一架戰斗機!

武器縱論
2026-04-09 22:35:26
2026-04-11 13:16:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2366文章數 8057關注度
往期回顧 全部

科技要聞

半夜被燃燒瓶砸醒,OpenAI CEO發文反思

頭條要聞

牛彈琴:伊朗很悲壯 向美國提高了"要價"

頭條要聞

牛彈琴:伊朗很悲壯 向美國提高了"要價"

體育要聞

換帥之后,他們從降級區沖到升級區

娛樂要聞

浪姐7淘汰 該走的沒走,不該走的走了

財經要聞

從日本翻身看:這次誰能扛住高油價?

汽車要聞

煥新極氪007/007GT上市 限時19.39萬起

態度原創

旅游
藝術
親子
公開課
軍事航空

旅游要聞

外灘“絕世美景”!99%的人不知道,5樓免費露臺,3萬株杜鵑花正在盛放!入口在這里→

藝術要聞

17位當代青年畫家油畫欣賞

親子要聞

童趣與春的浪漫共舞,兩只小精靈在花瓣堆里奔跑

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗議長帶四名遇難兒童照片赴美伊談判

無障礙瀏覽 進入關懷版