337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

「視頻世界模型」新突破:AI連續(xù)生成5分鐘,畫面也不崩

0
分享至



當(dāng) Sora 讓世界看到了 AI 生成視頻的驚艷效果,一個(gè)更深層的問題浮出水面:如何讓生成的視頻不只是「看起來像」,而是真正理解并遵循物理世界的規(guī)律?這正是「視頻世界模型」(Video World Model)要解決的核心挑戰(zhàn)。當(dāng)生成時(shí)長從幾秒擴(kuò)展到幾分鐘,模型不僅要畫面逼真,更要在長時(shí)間尺度上保持結(jié)構(gòu)、行為與物理規(guī)律的一致性。然而,誤差累積與語義漂移往往導(dǎo)致長視頻出現(xiàn)畫面退化與邏輯崩壞 —— 這已成為衡量世界模型能力的關(guān)鍵瓶頸。

圍繞這一挑戰(zhàn),上海人工智能實(shí)驗(yàn)室聯(lián)合復(fù)旦大學(xué)、南京大學(xué)、南洋理工大學(xué) S-Lab 等單位提出了LongVie 2—— 一個(gè)能夠生成長達(dá)5 分鐘高保真、可控視頻的世界模型框架



LongVie 2 可自回歸生成 3-5 分鐘的超長可控視頻

  • 論文:https://arxiv.org/pdf/2512.13604
  • 項(xiàng)目主頁:https://vchitect.github.io/LongVie2-project/
  • GitHub:https://github.com/Vchitect/LongVie
  • 視頻演示:https://www.youtube.com/watch?v=ln1kMNYj50Y


https://mp.weixin.qq.com/s/oMWv6P6mm21XMk9bpZtKXg

什么是理想的視頻世界模型?

一個(gè)理想的視頻世界模型,不應(yīng)只是「生成得更久」,而應(yīng)同時(shí)具備以下三項(xiàng)核心能力:

  • 全面可控性(Comprehensive Controllability):能夠在長時(shí)間生成過程中穩(wěn)定響應(yīng)多種控制信號,保持場景結(jié)構(gòu)與運(yùn)動意圖不漂移;
  • 長期視覺保真(Long-term Fidelity):隨著時(shí)間推進(jìn),畫面質(zhì)量不發(fā)生明顯退化,不出現(xiàn)紋理崩塌或細(xì)節(jié)丟失;
  • 長程上下文一致性(Long-context Consistency):跨片段、跨時(shí)間保持語義、身份與物理規(guī)律的一致,避免「換世界式」斷裂。

現(xiàn)有世界模型的瓶頸在哪里?

本文系統(tǒng)調(diào)研了當(dāng)前主流的視頻世界模型,發(fā)現(xiàn)一個(gè)共同問題:隨著生成時(shí)長的增加,模型的可控性、視覺保真度與時(shí)間一致性會同步下降。



現(xiàn)有模型在長時(shí)間生成時(shí)的退化問題

LongVie 2:三階段遞進(jìn)式訓(xùn)練

為系統(tǒng)性解決上述挑戰(zhàn),LongVie 2 設(shè)計(jì)了一套逐層遞進(jìn)的三階段訓(xùn)練策略,從控制、穩(wěn)定性到時(shí)間一致性層層強(qiáng)化:



LongVie 2 三階段訓(xùn)練流程

階段一:Dense & Sparse 多模態(tài)控制

通過引入稠密信號(如深度圖)與稀疏信號(如關(guān)鍵點(diǎn)軌跡),為模型提供穩(wěn)定且可解釋的世界約束。這使生成過程不再完全依賴隱式記憶,從源頭提升長程可控性。

階段二:退化感知訓(xùn)練(Degradation-aware Training)

長視頻生成中,質(zhì)量衰減幾乎不可避免。LongVie 2 的核心創(chuàng)新在于:在訓(xùn)練階段主動「制造困難」——



退化感知訓(xùn)練示意圖

  • 利用 VAE 的多次 encode-decode 模擬重建誤差;
  • 通過 加噪 + Diffusion 去噪 構(gòu)造退化圖像。

以此作為訓(xùn)練信號,使模型學(xué)會在不完美輸入下保持穩(wěn)定生成,顯著增強(qiáng)長期視覺保真度。

階段三:歷史上下文建模

在生成過程中顯式引入歷史片段信息,并通過針對性 loss 約束相鄰片段的銜接,使跨片段過渡更加自然順暢,有效緩解長視頻中的語義斷裂與邏輯跳變問題。



三階段訓(xùn)練效果對比

一圖看懂 LongVie 2 框架

通過多模態(tài)控制、退化感知訓(xùn)練與歷史上下文建模的協(xié)同設(shè)計(jì),LongVie 2 將長視頻生成從「片段拼接」提升為持續(xù)演化的世界建模過程:



LongVie 2 整體框架

從左至右,LongVie 2 首先將跨片段的稠密(深度)與稀疏(關(guān)鍵點(diǎn))控制視頻做全局歸一化,并為所有片段采用統(tǒng)一的噪聲初始化。隨后在每一片段生成時(shí),將全局歸一化后的控制信號、上一片段的末幀與文本提示送入模型,逐步生成完整的長視頻。

LongVie 2 能力展示

該研究將LongVie 2與 Go-With-The-Flow 和 Diffusion As Shader 進(jìn)行了對比。結(jié)果顯示,LongVie 2 在可控性方面表現(xiàn)顯著優(yōu)于現(xiàn)有方法:



與現(xiàn)有方法的可控性對比


https://mp.weixin.qq.com/s/oMWv6P6mm21XMk9bpZtKXg


https://mp.weixin.qq.com/s/oMWv6P6mm21XMk9bpZtKXg

消融實(shí)驗(yàn)也充分驗(yàn)證了三階段訓(xùn)練的有效性:



消融實(shí)驗(yàn)結(jié)果

LongVGenBench

首個(gè)可控超長視頻評測基準(zhǔn)

當(dāng)前缺乏面向可控長視頻生成的標(biāo)準(zhǔn)化評測。為此,本文提出LongVGenBench—— 首個(gè)專為超長視頻生成設(shè)計(jì)的基準(zhǔn)數(shù)據(jù)集,包含100 個(gè)時(shí)長超過 1 分鐘的高分辨率視頻,覆蓋真實(shí)世界與合成環(huán)境的多樣場景,旨在推動該方向的系統(tǒng)研究與公平評測。

定量評估與用戶主觀測評結(jié)果顯示,LongVie 2 在多項(xiàng)指標(biāo)上達(dá)到SOTA 水平,并獲得最高用戶偏好度:





定量評測結(jié)果與用戶研究

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進(jìn)了

歐洲人在性方面有多開放?德國再創(chuàng)歷史!女廁所、女浴室隨便進(jìn)了

西樓知趣雜談
2026-03-24 14:38:30
湖南一村內(nèi)發(fā)生地陷:農(nóng)田下陷道路斷層,專家到場勘測原因

湖南一村內(nèi)發(fā)生地陷:農(nóng)田下陷道路斷層,專家到場勘測原因

新京報(bào)
2026-03-29 10:28:14
猶太人啊,猶太資本啊,放過我們吧!我給你們跪了!

猶太人啊,猶太資本啊,放過我們吧!我給你們跪了!

紅色少女主播
2026-03-26 23:25:43
張雪峰靈堂花圈擺滿松柏:遺孀付幸保持沉默,前妻李麗婧也未露面

張雪峰靈堂花圈擺滿松柏:遺孀付幸保持沉默,前妻李麗婧也未露面

眼光很亮
2026-03-27 14:45:20
價(jià)格腰斬,300萬跌到150萬!昔日中產(chǎn)眼里的稀缺資產(chǎn)已成燙手山芋

價(jià)格腰斬,300萬跌到150萬!昔日中產(chǎn)眼里的稀缺資產(chǎn)已成燙手山芋

科學(xué)發(fā)掘
2026-03-29 10:33:26
張濤任山東省政府副秘書長、辦公廳主任

張濤任山東省政府副秘書長、辦公廳主任

汲古知新
2026-03-28 20:25:13
“東北超”大連隊(duì)球員名單已正式確定

“東北超”大連隊(duì)球員名單已正式確定

劉哥談體育
2026-03-29 10:08:42
烏克蘭必須為與美國決裂早做準(zhǔn)備

烏克蘭必須為與美國決裂早做準(zhǔn)備

近距離
2026-03-29 10:39:48
“華人神探”李昌鈺美國家中去世 四個(gè)月前回國時(shí)老態(tài)龍鐘 輪椅代步

“華人神探”李昌鈺美國家中去世 四個(gè)月前回國時(shí)老態(tài)龍鐘 輪椅代步

娛樂的硬糖吖
2026-03-28 16:49:28
霍啟山被曝和娜然婚期臨近,女方素顏生圖曝光狀態(tài)絕了

霍啟山被曝和娜然婚期臨近,女方素顏生圖曝光狀態(tài)絕了

橙星文娛
2026-03-28 11:42:28
沙特油輪繞開霍爾木茲抵達(dá)日本:世界油閥,被一腳踹開了!

沙特油輪繞開霍爾木茲抵達(dá)日本:世界油閥,被一腳踹開了!

老馬拉車莫少裝
2026-03-29 11:19:25
茶葉里也有“硼砂”?曝光茶圈5類“黑心貨”,教你4招快速辨?zhèn)?>
    </a>
        <h3>
      <a href=淚滿過眼
2026-03-25 02:46:47
又一個(gè)卡拉米倒下了,但這劇本咱們熟

又一個(gè)卡拉米倒下了,但這劇本咱們熟

老馬拉車莫少裝
2026-03-29 10:03:13
中東國家突然想到,中國武器再多再先進(jìn),也沒辦法保護(hù)他們!

中東國家突然想到,中國武器再多再先進(jìn),也沒辦法保護(hù)他們!

人間無味啊
2026-03-29 04:37:46
美媒評中國演員謝苗新片《火遮眼》“或成動作影史經(jīng)典”,該片5月29日北美上映,李連杰說很期待,聽說“超級牛”

美媒評中國演員謝苗新片《火遮眼》“或成動作影史經(jīng)典”,該片5月29日北美上映,李連杰說很期待,聽說“超級牛”

極目新聞
2026-03-26 20:16:01
越貴越好賣又應(yīng)驗(yàn),零跑A10對吉利和比亞迪的沖擊有多大

越貴越好賣又應(yīng)驗(yàn),零跑A10對吉利和比亞迪的沖擊有多大

路咖汽車
2026-03-29 09:00:03
俄烏戰(zhàn)場傳來血的教訓(xùn),我們最先進(jìn)的殲20,不能再抱著火箭彈不放

俄烏戰(zhàn)場傳來血的教訓(xùn),我們最先進(jìn)的殲20,不能再抱著火箭彈不放

安安說
2026-03-28 11:54:14
人老了,想多活幾年,先管住自己這10點(diǎn):1、不摔倒,2、不勞累…

人老了,想多活幾年,先管住自己這10點(diǎn):1、不摔倒,2、不勞累…

荷蘭豆愛健康
2026-03-28 09:28:48
黃健翔怒斥U23國足:踢友誼賽都蹲坑防守 中國足球跌到亞洲第幾流

黃健翔怒斥U23國足:踢友誼賽都蹲坑防守 中國足球跌到亞洲第幾流

念洲
2026-03-29 08:00:27
“只要愿意賣,啥電腦都收”,二手舊電腦回收行情大漲,回收商:漲幅遠(yuǎn)超手機(jī)價(jià)格,翻了5倍,16G內(nèi)存條幾十塊錢,漲到了五六百

“只要愿意賣,啥電腦都收”,二手舊電腦回收行情大漲,回收商:漲幅遠(yuǎn)超手機(jī)價(jià)格,翻了5倍,16G內(nèi)存條幾十塊錢,漲到了五六百

觀威海
2026-03-28 18:47:03
2026-03-29 12:12:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12620文章數(shù) 142598關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

牛彈琴:特朗普親口對沙特說出傲慢的話 全世界不敢相信

頭條要聞

牛彈琴:特朗普親口對沙特說出傲慢的話 全世界不敢相信

體育要聞

全球第二大車企,也救不了這支德甲隊(duì)?

娛樂要聞

張凌赫事件持續(xù)升級!官方點(diǎn)名怒批

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

旅游
親子
房產(chǎn)
公開課
軍事航空

旅游要聞

看北京|春日踏青哪里好?王佐鎮(zhèn)杏花古風(fēng)游園會等你來

親子要聞

優(yōu)奈才兩個(gè)多月就長牙了?帶她去打疫苗,月嫂阿姨也要離開了!

房產(chǎn)要聞

首日430組來訪,單日120組認(rèn)籌!海口首個(gè)真四代,徹底爆了!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍中東基地?fù)p失最新披露

無障礙瀏覽 進(jìn)入關(guān)懷版