3月19日,天工AI大模型SkyReels V4登上Artificial Analysis榜單Text to Video (With Audio) 賽道全球第一,顯著超越Kling 3.0、Google Veo 3.1、Vidu Q3、OpenAI Sora 2等全球主流模型,成為全球AI視頻生成能力最強(qiáng)的大模型,標(biāo)志中國(guó)AI視頻生成技術(shù)實(shí)現(xiàn)世界級(jí)引領(lǐng)。
![]()
![]()
榜單地址:https://artificialanalysis.ai/video/leaderboard/text-to-video?audio-output=true
同時(shí),SkyReels V4正式上線API入口,面向全場(chǎng)景開放API能力。
SkyReels V4 API核心能力完整覆蓋本模型的所有核心功能,從基礎(chǔ)的文生視頻、圖生視頻,到多模態(tài)參考生成、視頻編輯與修復(fù)、音畫聯(lián)合生成,全能力開放、支持靈活的參數(shù)配置,滿足不同場(chǎng)景的定制化需求。
無論是內(nèi)容平臺(tái)、電商平臺(tái)、教育機(jī)構(gòu)、品牌方,還是開發(fā)者團(tuán)隊(duì)、創(chuàng)作工作室等,無需從零開始搭建大模型,不用再投入巨額的研發(fā)成本,只需要通過SkyReels的API,即可直接調(diào)用這套全球頂尖的音視頻聯(lián)合生成能力,為自己的產(chǎn)品、業(yè)務(wù)、場(chǎng)景賦能。
我們希望將SkyReels V4的視頻生成核心能力嵌入到每一個(gè)有需求的場(chǎng)景里,賦能全行業(yè)的合作伙伴。
使用入口
SkyReels V4 官網(wǎng)地址:https://www.skyreels.ai/
SkyReelsV4 API地址:https://www.skyreels.ai/api-platform
SkyReels V4在雙流架構(gòu)解決音畫同步核心問題的基礎(chǔ)上,帶來兩大核心變革:一方面通過全模態(tài)強(qiáng)化學(xué)習(xí)(RL)為AI注入邏輯推理能力;另一方面,新增多幀參考、網(wǎng)格圖參考等高階任務(wù),將視頻生成的一致性與可控性推至行業(yè)新高度。
核心突破一:
全模態(tài)強(qiáng)化學(xué)習(xí)體系全面升級(jí),從語義Reward到階梯式課程學(xué)習(xí)
針對(duì)傳統(tǒng)擴(kuò)散模型重局部像素、輕整體語義邏輯、物理常識(shí)與敘事邏輯的行業(yè)痛點(diǎn),我們打造了一套從評(píng)判標(biāo)準(zhǔn)到成長(zhǎng)路徑的完整強(qiáng)化學(xué)習(xí)體系。
一方面搭建全模態(tài)語義Reward模型,覆蓋文生視頻(T2V)、圖生視頻(I2V)、視頻編輯、音視頻對(duì)齊全場(chǎng)景,為生成提供全局精準(zhǔn)的實(shí)時(shí)反饋,全方位優(yōu)化生成效果;另一方面采用階梯式課程強(qiáng)化學(xué)習(xí)路徑,從分辨率與時(shí)長(zhǎng)、任務(wù)復(fù)雜度、數(shù)據(jù)難度三個(gè)維度,讓模型由簡(jiǎn)入繁掌握復(fù)雜能力,最終實(shí)現(xiàn)1080p 15s商用長(zhǎng)序列生成,以及多任務(wù)大一統(tǒng)的能力框架。
該體系不僅實(shí)現(xiàn)了模型全任務(wù)能力的全面提升,更帶來了極強(qiáng)的跨任務(wù)泛化性,模型習(xí)得的視頻生成底層通用規(guī)律,可在不同任務(wù)間自由遷移。
核心突破二:
新增兩大高階參考任務(wù),大幅拓展應(yīng)用邊界
本次升級(jí)新增關(guān)鍵幀參考能力 (Keyframe Reference)與網(wǎng)格圖參考能力 (Grid Image Reference),全面提升視頻生成的穩(wěn)定性與靈活性。
其中,關(guān)鍵幀參考能力可基于用戶給定的多節(jié)點(diǎn)關(guān)鍵幀,精準(zhǔn)推演邏輯嚴(yán)密、動(dòng)作連貫的中間畫面,實(shí)現(xiàn)極強(qiáng)的時(shí)空補(bǔ)完能力;專為短劇生成打造的網(wǎng)格圖參考能力,支持用戶上傳至多9張劇情關(guān)鍵幀,模型可穩(wěn)定提取并保留角色特征與場(chǎng)景風(fēng)格,生成邏輯完整、角色與場(chǎng)景全程連貫的敘事視頻,解決了短劇生成中角色走形、場(chǎng)景跳躍的行業(yè)痛點(diǎn)。
做堅(jiān)實(shí)的技術(shù)賦能者,SkyReels與行業(yè)共同迎接AI視聽新時(shí)代
過去一年多,SkyReels團(tuán)隊(duì)致力于將 “生成專業(yè)、好用、有感染力的視聽內(nèi)容”,變成可復(fù)現(xiàn)、可控制、可迭代的系統(tǒng)能力。
昆侖萬維已經(jīng)陸續(xù)發(fā)布并開源多個(gè)SkyReels模型,包括SkyReels V1、SkyReels V2、SkyReels V3、SkyReels V4,以及SkyReels A1、SkyReels A2和SkyReels A3。
其中,2025年上半年,SkyReels A1模型發(fā)布,將人像動(dòng)畫、表情驅(qū)動(dòng)功能做到極致,打破AI人像 “僵硬、無靈魂” 的行業(yè)痛點(diǎn);2025年年中,SkyReels V2開源,攻克無限時(shí)長(zhǎng)影視生成核心難題,邁出從 “生成片段” 到 “生成故事” 的關(guān)鍵一步;2026年初,SkyReels V3升級(jí)迭代,多模態(tài)理解、畫面一致性、動(dòng)態(tài)流暢度、生成質(zhì)量全面躍升,完成從 “能生成” 到 “生成得好” 的跨越。
今天登頂Artificial Analysis榜單Text to Video (With Audio) 賽道全球第一,和用戶見面的SkyReels V4模型,不是偶然的技術(shù)爆發(fā),而是團(tuán)隊(duì)沿著高質(zhì)量視頻生成這條路,持續(xù)深耕、反復(fù)打磨,自然生長(zhǎng)出來的結(jié)果。它不是單點(diǎn)能力的升級(jí),而是從底層架構(gòu)到上層能力,從生成質(zhì)量到創(chuàng)作自由度,全維度的革新與突破。
未來,SkyReels希望在AI視聽這個(gè)全新的賽道上,做最堅(jiān)實(shí)的技術(shù)賦能者,用最頂尖的技術(shù)打破創(chuàng)作的門檻,與全行業(yè)伙伴一起,迎接這個(gè)屬于 AI 視聽的全新時(shí)代。
更多關(guān)于SkyReels
SkyReels V4 技術(shù)報(bào)告:https://arxiv.org/pdf/2602.21818
SkyReelsV4 API文檔:https://www.skyreels.ai/dev/document
SkyReelsV4 合作與反饋:feedback@skyreels.ai
SkyReels 系列開源模型地址:https://huggingface.co/Skywork
昆侖萬維
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.