4 月 7 日深夜,AI 評(píng)測平臺(tái) Artificial Analysis 在 X 上發(fā)了一條簡短的公告:Video Arena 新增了一個(gè)“pseudonymous”(匿名)視頻模型,代號(hào) HappyHorse-1.0。沒有發(fā)布會(huì),沒有技術(shù)博客,沒有任何機(jī)構(gòu)署名。
48 小時(shí)后,這個(gè)模型的 Elo 積分沖到了文本轉(zhuǎn)視頻賽道的 1,347 分,圖像轉(zhuǎn)視頻賽道的 1,391 分(如今已分別沖到 1,378 分和 1,411 分),雙雙登頂。它和第二名 Seedance 2.0 之間的分差達(dá)到 60 至 74 分,整個(gè)榜單上第二名到第十九名之間的累計(jì)分差,也不過 70 分出頭。
![]()
圖丨Video Arena 榜單(來源:Artificial Analysis)
字節(jié)的 Seedance 2.0 自今年 2 月發(fā)布以來一路大殺四方,先后壓過 Sora 2 和 Veo 3,被不少人視為當(dāng)前 AI 視頻生成的天花板。一個(gè)剛上線幾天的匿名模型把它甩開這么遠(yuǎn),網(wǎng)友難免好奇:“這是誰家的部將,竟如此勇猛?”
2026 年是農(nóng)歷馬年,再加上“HappyHorse”這個(gè)命名和今年 2 月匿名上線 OpenRouter 后被確認(rèn)為智譜 GLM-5 的“Pony Alpha”套路如出一轍,于是許多人猜測它應(yīng)該出自中國團(tuán)隊(duì)之手。
但“中國團(tuán)隊(duì)”的范圍太大了。社交媒體上的猜測眾說紛紜:騰訊和阿里的創(chuàng)始人都姓馬,有一定的可能性;還有人覺得像小米的風(fēng)格,因?yàn)榇饲鞍园竦哪涿P?Hunter Alpha 就出自小米。
目前可信度較高的猜測有兩個(gè),首先是 X 用戶 Vigo Zhao 將 HappyHorse-1.0 的公開基準(zhǔn)數(shù)據(jù)(視覺質(zhì)量 4.80、文本對(duì)齊 4.18、物理一致性 4.52、語音字錯(cuò)率 14.60%)逐項(xiàng)與已知模型核對(duì)后,結(jié)果找到了一個(gè)高度吻合的對(duì)象:今年 3 月底在 GitHub 開源的 daVinci-MagiHuman。兩者都是 150 億參數(shù)、40 層單流 Transformer 架構(gòu),都做音視頻聯(lián)合生成,支持的語言列表完全一致,官網(wǎng)的架構(gòu)描述和演示視頻的呈現(xiàn)風(fēng)格也幾乎同一套模板。
daVinci-MagiHuman 的開發(fā)方是 Sand.ai 和上海創(chuàng)智學(xué)院 GAIR 實(shí)驗(yàn)室的聯(lián)合團(tuán)隊(duì)。Sand.ai 創(chuàng)始人曹越是清華特等獎(jiǎng)學(xué)金得主、Swin Transformer 共同一作、ICCV 2021 馬爾獎(jiǎng)獲得者,2023 年創(chuàng)立 Sand.ai 后專注自回歸視頻生成方向,此前已開源過視頻大模型 MAGI-1,融資規(guī)模近六千萬美元。
但另一條線索把故事引向了別處。多家自媒體和財(cái)經(jīng)媒體報(bào)道稱,HappyHorse 背后的團(tuán)隊(duì)是阿里巴巴淘天集團(tuán)旗下的“未來生活實(shí)驗(yàn)室”,由張迪領(lǐng)銜。網(wǎng)上流傳的一個(gè)號(hào)稱是 HappyHorse 官網(wǎng)的頁面也寫明了淘天集團(tuán)的歸屬,但該官網(wǎng)的真實(shí)性尚未得到官方確認(rèn)。
張迪的履歷和 AI 視頻賽道深度綁定:2020 年至 2025 年任快手副總裁,主導(dǎo)搭建了可靈大模型的底層架構(gòu),業(yè)界稱其為“可靈之父”;2025 年短暫加入 B 站負(fù)責(zé)技術(shù)條線后回歸阿里,執(zhí)掌淘天集團(tuán)未來生活實(shí)驗(yàn)室。
兩條線索誰對(duì)誰錯(cuò),目前尚不得而知。
(順便一提,筆者在檢索相關(guān)信息時(shí)還發(fā)現(xiàn),微信在 25 年居然就出過一個(gè)名為“快樂馬”的卡通形象,所以不靠譜的猜測一下,沒準(zhǔn)真的出自騰訊團(tuán)隊(duì)。)
![]()
圖丨相關(guān)推文(來源:X)
不過話說回來,除去 Elo 分?jǐn)?shù),這個(gè)模型的水平究竟如何?
從目前網(wǎng)上流傳的實(shí)測視頻來看,HappyHorse 在許多場景下的表現(xiàn)的確與 Seedance 2.0 不分伯仲,部分場景甚至有所超越,但整體并沒有“全面領(lǐng)先”的觀感。比如在一些實(shí)測視頻中,它在物理真實(shí)性方面表現(xiàn)似乎就不如 Seedance 2.0。
我們也在 Artificial Analysis 平臺(tái)上進(jìn)行了實(shí)測。雖然沒能直接抽到 Seedance 2.0 與 HappyHorse 的對(duì)決,但在多次與其他模型的配對(duì)中,HappyHorse 的確時(shí)常是更勝一籌的那個(gè)。
比如在這個(gè)跑步場景里,Veo 3.1 Preview 和 HappyHorse 都存在問題,比如幾個(gè)人的動(dòng)作分解都沒有完全實(shí)現(xiàn),但 Veo 還額外出現(xiàn)了憑空冒出毛巾等穿幫。
而在這個(gè)打字機(jī)的場景下,在打字機(jī)的場景下,HappyHorse 對(duì)提示詞的執(zhí)行稱得上精準(zhǔn),字跡也相對(duì)清晰。相比之下,Kling 2.6 Pro 對(duì)“紙張向上卷起,被抽出并放在打字機(jī)旁”這個(gè)動(dòng)作就沒有正確理解。
而在另一個(gè)比較復(fù)雜的場景里,Happy Horse 居然做到了準(zhǔn)確理解了“建筑師”這個(gè)職業(yè)的工作,在電腦上生成了對(duì)應(yīng)的圖紙,其他細(xì)節(jié)也較為還原,表現(xiàn)非常出色。
需要指出的是,Artificial Analysis 的 Video Arena 完全基于真實(shí)用戶盲測投票,兩段視頻并排,用戶選更喜歡哪個(gè),模型團(tuán)隊(duì)無法刷題作弊。這套機(jī)制的優(yōu)點(diǎn)是直接反映普通人的視覺感知,但它有結(jié)構(gòu)性的局限,如果盲測素材以某一類特定場景為主,那么擅長該場景的模型就會(huì)拿到更高的勝率。
不少測試者在對(duì)比后認(rèn)為,HappyHorse 在人物細(xì)節(jié)和動(dòng)態(tài)連貫性上跟 Seedance 2.0 仍有可見差距,由此質(zhì)疑 Elo 評(píng)分能否代表綜合實(shí)力。
這種質(zhì)疑有它的道理。Elo 系統(tǒng)是純粹的偏好累積,最終分?jǐn)?shù)很大程度上取決于用戶傾向于提交什么樣的測試內(nèi)容。我們尚無從得知 HappyHorse 的投票總量,而 Seedance 2.0 僅在文本轉(zhuǎn)視頻類別就已積累超過 7,500 次投票樣本,隨著更多投票進(jìn)來,排名仍可能變動(dòng)。
但無論排名最終怎么調(diào)整,如果所謂的“官網(wǎng)”以及一大堆 GitHub 上出現(xiàn)的各個(gè)“coming soon”的倉庫是真的,那就意味著一個(gè)開源視頻模型在以用戶真實(shí)感知為基準(zhǔn)的盲測排行榜上,首次正面比肩了當(dāng)前主流閉源競爭對(duì)手。這對(duì)用戶來說是件好事,Seedance 2.0 效果雖好,但價(jià)格不低,等候時(shí)間也長,市場需要更多選項(xiàng)。
參考資料:
1.https://artificialanalysis.ai/video/leaderboard/text-to-video
2.https://x.com/yyyole/status/2041876401754919422
3.https://wavespeed.ai/blog/posts/what-is-happyhorse-1-0-ai-video-model/
運(yùn)營/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.