周二深夜,AI圈炸了。
在全球知名AI評(píng)測(cè)平臺(tái)Artificial Analysis的Video Arena榜單上,一個(gè)代號(hào)為「HappyHorse-1.0」的神秘視頻生成模型悄然空降——沒有發(fā)布會(huì),沒有技術(shù)博客,沒有任何公司背書,直接以碾壓式的姿態(tài)登頂榜首。
截止發(fā)稿,文本生視頻賽道,Elo積分飆至1357分,領(lǐng)先剛登頂五天的Seedance 2.0 84分,比第三名和第四名的SkyReels V4和Kling 3.0 1080p Pro高出超過100分。HappyHorse-1.0一個(gè)模型,就拉開了整個(gè)行業(yè)梯隊(duì)的差距。
![]()
圖像生視頻賽道更是跑出了1402的恐怖高分,刷新了該榜單的歷史紀(jì)錄。
![]()
唯一稍顯遜色的,是在包含原生音效的「視頻+音頻」綜合排名上,HappyHorse屈居第二,略低于Seedance 2.0。
![]()
這個(gè)榜單,沒那么容易刷
很多人第一反應(yīng)是:這不會(huì)是刷分吧?
這個(gè)質(zhì)疑并非沒有道理。但Artificial Analysis的排名機(jī)制,決定了它比普通跑分榜更難被輕易操控——所有排名均來自全球真實(shí)用戶的「蒙眼二選一」盲測(cè)投票,用戶在完全不知情的情況下,對(duì)兩段生成結(jié)果進(jìn)行對(duì)比選擇,最終匯總成Elo積分。
模型團(tuán)隊(duì)無法通過刷題作弊,反映的是普通人看過之后最真實(shí)的感知偏好。
當(dāng)然,也有人指出,Artificial Analysis的盲測(cè)樣本中人像生成、口播類內(nèi)容占比超過60%,而HappyHorse在人像場(chǎng)景上天然具備優(yōu)勢(shì),這在一定程度上可能造成了評(píng)測(cè)分?jǐn)?shù)與實(shí)際綜合能力之間的落差。
X上的討論者也因此分成了兩派:懷疑派認(rèn)為HappyHorse與Seedance 2.0在人物細(xì)節(jié)、動(dòng)態(tài)連貫性上仍有可見差距;支持者則對(duì)其潛力寄予厚望,尤其期待它能解決多鏡頭序列中畫質(zhì)一致性這一行業(yè)痛點(diǎn)。
其次,根據(jù)網(wǎng)上的測(cè)評(píng),普通人對(duì)這款模型的評(píng)價(jià)普遍很高。
![]()
![]()
![]()
![]()
"歡樂馬"究竟是誰的馬?
這才是整個(gè)AI圈最想搞清楚的問題。
![]()
X上的猜測(cè)來得很快。最先被注意到的,是官網(wǎng)的語言排序:普通話和粵語排在英語前面。對(duì)于一個(gè)面向全球用戶的產(chǎn)品,這個(gè)順序相當(dāng)反常——背后團(tuán)隊(duì)來自中國,基本可以確認(rèn)。
名字本身也是線索。2026年是農(nóng)歷馬年,「HappyHorse」這個(gè)命名藏著不太含蓄的馬年梗,今年早些時(shí)候「Pony Alpha」也玩過類似套路。于是嫌疑名單迅速拉長:騰訊和阿里的創(chuàng)始人都姓馬,天然在列;有人押注小米,覺得雷軍一貫低調(diào),喜歡突然亮牌;也有人覺得氣質(zhì)更像DeepSeek,畢竟DS此前曾悄悄上線過視覺模型,后來又悄悄下線了。
X用戶Passluo的評(píng)論頗為意味深長:"這匹快樂馬是誰的?阿里、騰訊,還是小米?"
![]()
技術(shù)層面的"破案"
光靠名字猜不夠,技術(shù)圈隨即開啟了福爾摩斯模式。
X用戶Vigo Zhao把HappyHorse-1.0的公開基準(zhǔn)數(shù)據(jù)拿去和已知模型逐條核對(duì),找到了一個(gè)高度吻合的對(duì)象:daVinci-MagiHuman——也就是今年3月上線GitHub的開源模型「達(dá)芬奇魔法人類」。
![]()
視覺質(zhì)量、文本對(duì)齊、物理一致性等多項(xiàng)數(shù)據(jù)逐項(xiàng)對(duì)得上,官網(wǎng)結(jié)構(gòu)也幾乎一樣,兩者同為單流Transformer架構(gòu),同為音視頻聯(lián)合生成,支持的語言列表完全一致。這種程度的重合,很難用巧合解釋。
目前技術(shù)圈認(rèn)可度較高的結(jié)論是:HappyHorse是daVinci-MagiHuman聯(lián)合開發(fā)方之一的Sand.ai,基于開源模型優(yōu)化的迭代版本,核心目的是驗(yàn)證模型在用戶真實(shí)偏好下的表現(xiàn)上限,為后續(xù)商業(yè)化落地做鋪墊。
daVinci-MagiHuman于2026年3月23日正式開源,是兩支年輕團(tuán)隊(duì)合作的產(chǎn)物:
一支來自上海創(chuàng)智學(xué)院生成式AI研究實(shí)驗(yàn)室,另一支是北京的Sand.ai(三呆科技)。模型采用150億參數(shù)的純自注意力單流Transformer,將文本、視頻、音頻三種模態(tài)的token全部塞進(jìn)同一個(gè)序列里聯(lián)合建模。
另一條線索,指向阿里淘天
與此同時(shí),坊間還流傳著另一個(gè)版本的猜測(cè):
HappyHorse背后的核心團(tuán)隊(duì),來自阿里淘天集團(tuán)「未來生活實(shí)驗(yàn)室」,由前快手副總裁、可靈技術(shù)負(fù)責(zé)人張迪領(lǐng)銜。
公開資料顯示,張迪于2025年底加盟阿里,執(zhí)掌淘天集團(tuán)「未來生活實(shí)驗(yàn)室」。該實(shí)驗(yàn)室是阿里電商核心算法團(tuán)隊(duì),集結(jié)了頂尖技術(shù)人才與核心算力資源,專注大模型與多模態(tài)前沿領(lǐng)域,成立僅一年有余,已在國際頂會(huì)發(fā)表10余篇高質(zhì)量論文。
值得一提的是,這一傳聞發(fā)酵的時(shí)間節(jié)點(diǎn),恰好與阿里港股今日的活躍表現(xiàn)有所重疊——當(dāng)然,這只是一個(gè)有趣的巧合,目前并無任何實(shí)錘將兩者直接掛鉤,不宜過度解讀。
![]()
這件事真正重要的信號(hào)
不論HappyHorse最終花落誰家,這次事件傳遞的行業(yè)信號(hào)已經(jīng)足夠清晰。
長期以來,開源視頻模型與閉源產(chǎn)品之間橫亙著一道效果層面的可見差距——在需要向客戶交付的場(chǎng)景里,開源模型的生成質(zhì)量始終未能跨過「可用」到「可交付」的門檻。可靈、Seedance等閉源產(chǎn)品的定價(jià)權(quán),在相當(dāng)程度上正是建立在這一差距之上。
這一次,一個(gè)基于開源模型的產(chǎn)品,在以真實(shí)用戶感知為基準(zhǔn)的盲測(cè)排行榜上,首次正面比肩了當(dāng)前主流閉源競爭對(duì)手。
對(duì)于依賴這一差距構(gòu)建定價(jià)權(quán)的閉源廠商而言,這至少是一個(gè)值得認(rèn)真對(duì)待的信號(hào)。
按照Artificial Analysis的「盲測(cè)屠榜」慣例,當(dāng)一個(gè)匿名模型賺足關(guān)注度后,官方通常會(huì)在一周內(nèi)正式「認(rèn)領(lǐng)」。
或許就在這幾天,我們就會(huì)知道答案了。
在這個(gè)馬年,真正值得關(guān)注的,或許不是哪匹馬跑得最快,而是賽道本身,正在變寬。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.