網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI視頻殺出一匹快樂黑馬：把Seedance 2.0擠下榜首，幕后團(tuán)隊(duì)成謎

2026-04-09 18:13:23　來源: DeepTech深科技

北京舉報(bào)

分享至

4 月 7 日深夜，AI 評(píng)測平臺(tái) Artificial Analysis 在 X 上發(fā)了一條簡短的公告：Video Arena 新增了一個(gè)“pseudonymous”（匿名）視頻模型，代號(hào) HappyHorse-1.0。沒有發(fā)布會(huì)，沒有技術(shù)博客，沒有任何機(jī)構(gòu)署名。

48 小時(shí)后，這個(gè)模型的 Elo 積分沖到了文本轉(zhuǎn)視頻賽道的 1,347 分，圖像轉(zhuǎn)視頻賽道的 1,391 分（如今已分別沖到 1,378 分和 1,411 分），雙雙登頂。它和第二名 Seedance 2.0 之間的分差達(dá)到 60 至 74 分，整個(gè)榜單上第二名到第十九名之間的累計(jì)分差，也不過 70 分出頭。

圖丨Video Arena 榜單（來源：Artificial Analysis）

字節(jié)的 Seedance 2.0 自今年 2 月發(fā)布以來一路大殺四方，先后壓過 Sora 2 和 Veo 3，被不少人視為當(dāng)前 AI 視頻生成的天花板。一個(gè)剛上線幾天的匿名模型把它甩開這么遠(yuǎn)，網(wǎng)友難免好奇：“這是誰家的部將，竟如此勇猛？”

2026 年是農(nóng)歷馬年，再加上“HappyHorse”這個(gè)命名和今年 2 月匿名上線 OpenRouter 后被確認(rèn)為智譜 GLM-5 的“Pony Alpha”套路如出一轍，于是許多人猜測它應(yīng)該出自中國團(tuán)隊(duì)之手。

但“中國團(tuán)隊(duì)”的范圍太大了。社交媒體上的猜測眾說紛紜：騰訊和阿里的創(chuàng)始人都姓馬，有一定的可能性；還有人覺得像小米的風(fēng)格，因?yàn)榇饲鞍园竦哪涿Ｐ?Hunter Alpha 就出自小米。

目前可信度較高的猜測有兩個(gè)，首先是 X 用戶 Vigo Zhao 將 HappyHorse-1.0 的公開基準(zhǔn)數(shù)據(jù)（視覺質(zhì)量 4.80、文本對(duì)齊 4.18、物理一致性 4.52、語音字錯(cuò)率 14.60%）逐項(xiàng)與已知模型核對(duì)后，結(jié)果找到了一個(gè)高度吻合的對(duì)象：今年 3 月底在 GitHub 開源的 daVinci-MagiHuman。兩者都是 150 億參數(shù)、40 層單流 Transformer 架構(gòu)，都做音視頻聯(lián)合生成，支持的語言列表完全一致，官網(wǎng)的架構(gòu)描述和演示視頻的呈現(xiàn)風(fēng)格也幾乎同一套模板。

daVinci-MagiHuman 的開發(fā)方是 Sand.ai 和上海創(chuàng)智學(xué)院 GAIR 實(shí)驗(yàn)室的聯(lián)合團(tuán)隊(duì)。Sand.ai 創(chuàng)始人曹越是清華特等獎(jiǎng)學(xué)金得主、Swin Transformer 共同一作、ICCV 2021 馬爾獎(jiǎng)獲得者，2023 年創(chuàng)立 Sand.ai 后專注自回歸視頻生成方向，此前已開源過視頻大模型 MAGI-1，融資規(guī)模近六千萬美元。

但另一條線索把故事引向了別處。多家自媒體和財(cái)經(jīng)媒體報(bào)道稱，HappyHorse 背后的團(tuán)隊(duì)是阿里巴巴淘天集團(tuán)旗下的“未來生活實(shí)驗(yàn)室”，由張迪領(lǐng)銜。網(wǎng)上流傳的一個(gè)號(hào)稱是 HappyHorse 官網(wǎng)的頁面也寫明了淘天集團(tuán)的歸屬，但該官網(wǎng)的真實(shí)性尚未得到官方確認(rèn)。

張迪的履歷和 AI 視頻賽道深度綁定：2020 年至 2025 年任快手副總裁，主導(dǎo)搭建了可靈大模型的底層架構(gòu)，業(yè)界稱其為“可靈之父”；2025 年短暫加入 B 站負(fù)責(zé)技術(shù)條線后回歸阿里，執(zhí)掌淘天集團(tuán)未來生活實(shí)驗(yàn)室。

兩條線索誰對(duì)誰錯(cuò)，目前尚不得而知。

（順便一提，筆者在檢索相關(guān)信息時(shí)還發(fā)現(xiàn)，微信在 25 年居然就出過一個(gè)名為“快樂馬”的卡通形象，所以不靠譜的猜測一下，沒準(zhǔn)真的出自騰訊團(tuán)隊(duì)。）

圖丨相關(guān)推文（來源：X）

不過話說回來，除去 Elo 分?jǐn)?shù)，這個(gè)模型的水平究竟如何？

從目前網(wǎng)上流傳的實(shí)測視頻來看，HappyHorse 在許多場景下的表現(xiàn)的確與 Seedance 2.0 不分伯仲，部分場景甚至有所超越，但整體并沒有“全面領(lǐng)先”的觀感。比如在一些實(shí)測視頻中，它在物理真實(shí)性方面表現(xiàn)似乎就不如 Seedance 2.0。

我們也在 Artificial Analysis 平臺(tái)上進(jìn)行了實(shí)測。雖然沒能直接抽到 Seedance 2.0 與 HappyHorse 的對(duì)決，但在多次與其他模型的配對(duì)中，HappyHorse 的確時(shí)常是更勝一籌的那個(gè)。

比如在這個(gè)跑步場景里，Veo 3.1 Preview 和 HappyHorse 都存在問題，比如幾個(gè)人的動(dòng)作分解都沒有完全實(shí)現(xiàn)，但 Veo 還額外出現(xiàn)了憑空冒出毛巾等穿幫。

而在這個(gè)打字機(jī)的場景下，在打字機(jī)的場景下，HappyHorse 對(duì)提示詞的執(zhí)行稱得上精準(zhǔn)，字跡也相對(duì)清晰。相比之下，Kling 2.6 Pro 對(duì)“紙張向上卷起，被抽出并放在打字機(jī)旁”這個(gè)動(dòng)作就沒有正確理解。

而在另一個(gè)比較復(fù)雜的場景里，Happy Horse 居然做到了準(zhǔn)確理解了“建筑師”這個(gè)職業(yè)的工作，在電腦上生成了對(duì)應(yīng)的圖紙，其他細(xì)節(jié)也較為還原，表現(xiàn)非常出色。

需要指出的是，Artificial Analysis 的 Video Arena 完全基于真實(shí)用戶盲測投票，兩段視頻并排，用戶選更喜歡哪個(gè)，模型團(tuán)隊(duì)無法刷題作弊。這套機(jī)制的優(yōu)點(diǎn)是直接反映普通人的視覺感知，但它有結(jié)構(gòu)性的局限，如果盲測素材以某一類特定場景為主，那么擅長該場景的模型就會(huì)拿到更高的勝率。

不少測試者在對(duì)比后認(rèn)為，HappyHorse 在人物細(xì)節(jié)和動(dòng)態(tài)連貫性上跟 Seedance 2.0 仍有可見差距，由此質(zhì)疑 Elo 評(píng)分能否代表綜合實(shí)力。

這種質(zhì)疑有它的道理。Elo 系統(tǒng)是純粹的偏好累積，最終分?jǐn)?shù)很大程度上取決于用戶傾向于提交什么樣的測試內(nèi)容。我們尚無從得知 HappyHorse 的投票總量，而 Seedance 2.0 僅在文本轉(zhuǎn)視頻類別就已積累超過 7,500 次投票樣本，隨著更多投票進(jìn)來，排名仍可能變動(dòng)。

但無論排名最終怎么調(diào)整，如果所謂的“官網(wǎng)”以及一大堆 GitHub 上出現(xiàn)的各個(gè)“coming soon”的倉庫是真的，那就意味著一個(gè)開源視頻模型在以用戶真實(shí)感知為基準(zhǔn)的盲測排行榜上，首次正面比肩了當(dāng)前主流閉源競爭對(duì)手。這對(duì)用戶來說是件好事，Seedance 2.0 效果雖好，但價(jià)格不低，等候時(shí)間也長，市場需要更多選項(xiàng)。

參考資料：

1.https://artificialanalysis.ai/video/leaderboard/text-to-video

2.https://x.com/yyyole/status/2041876401754919422

3.https://wavespeed.ai/blog/posts/what-is-happyhorse-1-0-ai-video-model/

運(yùn)營/排版：何晨龍

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.