![]()
HappyOyster官網(wǎng)視頻截圖
阿里巴巴今日正式發(fā)布世界模型產(chǎn)品 HappyOyster(快樂生蠔),該產(chǎn)品支持用戶實時構(gòu)建可互動、可演繹、可探索的 AI 數(shù)字世界(官網(wǎng)鏈接:https://www.happyoyster.cn/)。這是繼視頻生成模型HappyHorse 之后,阿里 ATH 創(chuàng)新事業(yè)部在 AI 領(lǐng)域的又一重磅發(fā)布。
據(jù)悉,HappyOyster 基于原生多模態(tài)架構(gòu)構(gòu)建,支持多模態(tài)理解與音視頻聯(lián)合生成,目前已實現(xiàn)漫游(Wander)和導(dǎo)演(Direct)兩大核心能力。用戶生成的數(shù)字世界不僅能被完整保存,還可開放給其他用戶進行二次創(chuàng)作,不過該產(chǎn)品目前處于限量早期體驗階段。
世界模擬器流派的差異化競爭
相比大語言模型相對成熟的模型架構(gòu)和技術(shù)范式,世界模型仍屬于前沿探索領(lǐng)域。阿里的 HappyOyster 與谷歌的 Genie3 同屬于"世界模擬器"流派。區(qū)別于傳統(tǒng)文生視頻模型"輸入提示詞—等待渲染—獲得成片"的被動流程,這一流派采用長時間跨度上的世界演化建模方式。
通過學(xué)習(xí)海量長視頻數(shù)據(jù),以及文本、動作指令、圖像參考等多樣控制信號,模型能夠主動理解空間、物理與因果規(guī)律,預(yù)測情節(jié)和畫面的演變,從而把"被動生成內(nèi)容"轉(zhuǎn)變?yōu)?主動模擬世界演化"。據(jù)阿里官方產(chǎn)品介紹,HappyOyster 采用了時間跨度更長的世界演化建模方式,使得模型能夠保持高保真、長時序的動態(tài)場景生成。
在國際競爭格局中,騰訊已于同日發(fā)布并開源混元 3D 世界模型 2.0(HY-World 2.0),該模型可直接生成可二次編輯的 3D 資產(chǎn)文件,支持與現(xiàn)有游戲工作流無縫對接;Alphabet 旗下谷歌則運營著閉源的世界模型 Genie 系列。此次阿里入局,標(biāo)志著中國科技公司在這一前沿領(lǐng)域的進一步布局。
在產(chǎn)品能力上,HappyOyster 差異化優(yōu)勢在于,漫游模式(Wander)下,用戶僅需一句話或一張圖,即可生成具備物理一致性的完整空間,物體位置穩(wěn)定、場景持久存在,視角與光照也能跟隨第一人稱視角持續(xù)移動。目前 HappyOyster 支持長達 1 分鐘的連續(xù)實時位移與鏡頭控制,并支持多樣化的風(fēng)格切換。
導(dǎo)演模式(Direct)則是 HappyOyster 的獨家功能。用戶能夠在視頻的任意節(jié)點,通過文字、語音或圖像等多模態(tài)輸入,隨時實現(xiàn)鏡頭切換、劇情改寫、角色調(diào)度,在充分的交互中生成一個光照、重力、角色動作與場景因果持續(xù)演化的世界,并能選擇題材風(fēng)格。目前,導(dǎo)演模式支持連續(xù)生成 3 分鐘以上的 480p 或 720p 實時畫面。
值得注意的是,當(dāng)前漫游與導(dǎo)演兩大模式尚未完全打通。未來用戶有望在漫游過程中直接與世界深度互動、實時改寫場景規(guī)則,真正實現(xiàn)邊探索、邊創(chuàng)造的無縫融合體驗。
場景:游戲、影視、文旅
世界模型的發(fā)展仍處于早期階段,但在實際應(yīng)用中,HappyOyster 已在改變傳統(tǒng)的內(nèi)容創(chuàng)作模式和交互體驗。
在游戲領(lǐng)域,開發(fā)者可快速生成可玩原型,玩家能實時驅(qū)動世界演化,無需預(yù)設(shè)腳本即可實現(xiàn)動態(tài)劇情分支與開放世界探索,大幅降低內(nèi)容生產(chǎn)成本并提升沉浸感。在影視創(chuàng)作中,導(dǎo)演無需等待漫長的渲染周期,只需用自然語言描述創(chuàng)意,系統(tǒng)即可實時生成分鏡畫面,并支持在視頻的任意節(jié)點改變鏡頭、角色和劇情,讓創(chuàng)意驗證時間大大縮短。
在文旅與教育領(lǐng)域,用戶不再被動觀看歷史復(fù)原視頻,而是能以第一視角走進名畫現(xiàn)場或過往文明,在交互中探索因果、改寫走向,實現(xiàn)從知識傳遞到沉浸體驗的躍遷。
未來,HappyOyster 還能應(yīng)用于線下智能空間或娛樂場景,例如與穿戴設(shè)備等智能硬件結(jié)合,根據(jù)人的位置、動作與語言動態(tài),實時生成沉浸式內(nèi)容,讓數(shù)字世界與現(xiàn)實共振。
此次發(fā)布是阿里近期密集推出 AI 產(chǎn)品的最新動作。據(jù)報道,阿里巴巴已將云計算與 AI 業(yè)務(wù)確立為核心增長引擎,并設(shè)定目標(biāo),計劃在五年內(nèi)將相關(guān)年收入提升至 1000 億美元。阿里集團 CEO 吳泳銘在 2026 財年 Q3 財報電話會議上宣布了這一目標(biāo),較現(xiàn)有規(guī)模增長約五倍。財報顯示,阿里云本季度收入同比增長 36%,AI 相關(guān)產(chǎn)品收入連續(xù)第十個季度實現(xiàn)三位數(shù)增長。
HappyOyster 由阿里旗下新設(shè)業(yè)務(wù)單元 Token Hub(ATH 創(chuàng)新事業(yè)部)研發(fā),與此前發(fā)布的 HappyHorse 同屬一個團隊。阿里近期持續(xù)加快 AI 產(chǎn)品發(fā)布節(jié)奏,并對內(nèi)部組織架構(gòu)進行調(diào)整,以強化技術(shù)商業(yè)化落地能力,推動前期投入轉(zhuǎn)化為實際營收。
世界模型的"iPhone 時刻"何時到來?
盡管技術(shù)層面展現(xiàn)出差異化優(yōu)勢,但 HappyOyster 的商業(yè)化路徑仍待觀察。目前該產(chǎn)品僅向部分用戶開放早期訪問權(quán)限,大規(guī)模商業(yè)化模式尚未明確。
世界模型作為前沿探索領(lǐng)域,其技術(shù)成熟度與市場接受度仍需時間驗證。相較于大語言模型已形成相對清晰的商業(yè)模式,世界模型在游戲、影視、文旅等場景的付費意愿、定價策略、生態(tài)建設(shè)等方面仍有待探索。此外,如何平衡生成質(zhì)量、實時性與成本控制,也是產(chǎn)品規(guī)模化過程中需要解決的問題。
在國際競爭中,谷歌 Genie 系列仍保持閉源狀態(tài),已積累較多技術(shù)儲備;騰訊混元 3D 世界模型 2.0 采取開源策略,可直接導(dǎo)出 3D 資產(chǎn)文件搶占開發(fā)者生態(tài)。阿里 HappyOyster 選擇在此時入局,既是對自身多模態(tài)技術(shù)能力的信心體現(xiàn),也是在 AI 基礎(chǔ)設(shè)施層面的戰(zhàn)略布局。
從技術(shù)演進角度看,HappyOyster 的發(fā)布標(biāo)志著世界模型從實驗室研究向產(chǎn)品化邁出關(guān)鍵一步。其漫游與導(dǎo)演的雙模式設(shè)計,為交互式內(nèi)容創(chuàng)作提供了新的可能性。然而,正如大語言模型經(jīng)歷了多年迭代才迎來 ChatGPT 的爆發(fā),世界模型距離真正的"iPhone 時刻"或許仍有距離。
對于阿里而言,HappyOyster 不僅是技術(shù)實力的展示,更是其在 AI 時代爭奪內(nèi)容生產(chǎn)基礎(chǔ)設(shè)施話語權(quán)的重要嘗試。在谷歌、騰訊等巨頭的環(huán)伺之下,這款產(chǎn)品的市場表現(xiàn)與技術(shù)迭代速度,將決定阿里能否在世界模型賽道占據(jù)一席之地。(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 秦聰慧)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.