337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

片段生成到長視頻漫游:OmniRoam探索軌跡可控的長視頻生成新范式

0
分享至



在生成式視頻快速發展的今天,模型已經能夠生成高質量的短視頻片段,但一個更具挑戰性的問題正逐漸成為研究焦點:

如何生成長時間、可連續演化的視頻序列?當生成從 “幾秒” 走向 “長時序” 時,問題開始顯現:視角變化帶來的結構漂移、時間推進中的內容不一致,使得視頻在空間與時間維度上難以保持穩定,往往 “走著走著就亂了”。

與此同時,如何讓視頻生成具備可控性,能夠沿指定路徑連續移動,也成為實際應用中的關鍵需求。

近日,來自 University of California, Irvine、University of California, San Diego、City University of Hong Kong、University of Pennsylvania 以及 Adobe Research 的研究者共同提出了 OmniRoam,一種面向軌跡可控長視頻生成的新方法。



  • 論文標題:OmniRoam: World Wandering via Long-Horizon Panoramic Video Generation
  • 項目主頁:https://yuheng.ink/project-page/omniroam/
  • 文章鏈接:https://arxiv.org/pdf/2603.30045
  • 代碼鏈接:https://github.com/yuhengliu02/OmniRoam

該工作通過引入全景視頻作為統一表示,并結合 coarse-to-fine 的分階段生成框架,在長時序條件下顯著提升了視頻的空間一致性與時間連貫性,使模型能夠生成沿指定路徑連續演化的視頻序列,邁出了從 “片段生成” 走向 “連續過程生成” 的關鍵一步。



一、軌跡控制的視頻預覽

先生成 “可控路徑”

OmniRoam 首先生成一個中等分辨率的全景視頻預覽,用于確定整體路徑與場景結構。

核心在于將相機軌跡拆解為 flow(方向)和 scale(步長)兩個控制量:前者刻畫運動方向,后者控制移動幅度,從而實現更清晰的軌跡建模。在實現上,模型將輸入與目標視頻在時間維拼接,并通過 flow 與 scale 進行條件調制,使生成過程既保持內容連續,又具備明確的路徑約束。

二、長時序視頻細化

從預覽到高質量生成

在 preview 基礎上,OmniRoam 進一步進行長時序細化生成。由于 preview 通常采用較大 scale(類似 “快進”),refinement 階段會通過 scale 對齊,將視頻擴展為更長、更接近真實速度的序列。

關鍵設計是 visibility mask:每個時間段只選取少量 preview 幀作為條件輸入,在保留結構錨點的同時避免冗余。隨后模型對各個 segment 進行高分辨率生成,并拼接得到最終長視頻。

這種從 “全局預覽” 到 “局部細化” 的過程,有效緩解了長序列中的誤差累積問題。



三、新數據集與評測基準

支撐長視頻生成

為支持該任務,OmniRoam 構建了專門的數據與評測體系。在表示上,文章定義了一個 canonical panoramic coordinate system,去除相機自旋轉,僅保留平移,從而簡化軌跡建模。數據方面結合真實與合成兩部分:真實全景視頻提供多樣場景,合成數據提供精確軌跡監督,并通過路徑規劃保證運動合理性。在評測上,提出 loop consistency 指標,要求視頻沿閉環路徑生成后既能回到起點,又保持中間過程的合理變化,更好衡量長時序一致性。



四、實驗結果

一致性與可控性的顯著提升

實驗結果表明,OmniRoam 在畫質、軌跡控制和長時序一致性上均優于現有方法。

在定性結果中,模型能夠穩定沿指定路徑生成連續視頻,顯著減少結構漂移與內容崩塌;而在定量指標上(如 FAED、SSIM、LPIPS 及 loop consistency),均取得更優表現。



進一步分析顯示,全景表示與兩階段生成設計是性能提升的關鍵,使模型在長視頻場景下依然保持穩定與可控。文章重點分析了在長視頻(641 幀)條件下不同方法的表現,包括自回歸生成與基于透視表示的方法。為了進一步分析長時序一致性,作者設計了閉環軌跡實驗,并用 CLIP 相似度衡量模型是否能夠 “走回原點”。理想情況下,隨著相機逐漸遠離起點,相似度應逐步下降;而在軌跡閉環時,相似度應重新上升。相似度在中段下降,在末尾重新回升,說明模型具備較強的長期空間記憶能力。



五、擴展與應用

從實時預覽到 3D 場景生成

除了長視頻生成能力,OmniRoam 還展示了在效率與 3D 任務上的潛在應用。

在效率方面,作者基于 self-forcing 機制,將完整模型蒸餾為一個輕量級自回歸預覽模型,實現實時視頻生成。該模型在保持整體場景結構的同時,可在約 7 秒內生成 81 幀全景視頻,相比原始模型顯著加速,為交互式應用提供了可能。同時,還支持先生成低分辨率視頻,再通過 refinement 模塊提升至更高分辨率(如 720p)。

在 3D 應用方面,OmniRoam 生成的長視頻可直接用于 3D 場景重建。作者從生成視頻中均勻采樣關鍵幀,并提取多個透視視角輸入到 3D Gaussian Splatting(3DGS)中進行重建。實驗結果表明,生成視頻在不同視角間保持良好的一致性,能夠恢復出結構連貫的 3D 場景。

這些結果表明,OmniRoam 不僅可以生成長時序視頻,還能夠作為上游模塊,為實時交互與 3D 內容構建提供支持。



六、總結

長視頻生成邁向 “可持續演化”

OmniRoam 的核心貢獻,并不只是生成更長的視頻,而是在長時序條件下,實現了更穩定、更可控的生成過程。通過全景表示提供全局空間約束,并結合 trajectory-controlled preview 與 long-horizon refinement 的兩階段設計,模型能夠在長時間范圍內有效抑制漂移,維持結構與語義的一致性。

這也反映出一個更重要的趨勢:

視頻生成的挑戰,正在從 “生成更清晰的內容”,轉向 “如何在更長時間內保持一致性與連貫性”。在這一背景下,OmniRoam 提供了一種可行路徑,使生成模型能夠沿指定軌跡持續演化,為長視頻生成、虛擬漫游等場景奠定了基礎。

如果說短視頻生成解決的是 “生成一段內容”,那么長時序生成更關心的是 —— 模型能否在時間推移中持續 “記住并延續” 這個場景。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美國的陰謀藏不住了!臺海南海就是幌子,真正目標是中國最大王牌

美國的陰謀藏不住了!臺海南海就是幌子,真正目標是中國最大王牌

歲暮的歸南山
2026-04-18 20:00:55
前世界第一中鋒!天王山統治內線取賽點:總決賽三戰69+36+6帽

前世界第一中鋒!天王山統治內線取賽點:總決賽三戰69+36+6帽

顏小白的籃球夢
2026-04-20 09:46:55
人心惶惶!兩位經理被裁拿到23萬、13萬補償,重慶網友發帖引熱議

人心惶惶!兩位經理被裁拿到23萬、13萬補償,重慶網友發帖引熱議

火山詩話
2026-04-20 05:59:58
“我老公喜歡大胸,能做多大做多大”,女子身高174,體重47公斤,想做隆胸手術被醫生勸退,醫生:她本身是A減,一心想做E杯

“我老公喜歡大胸,能做多大做多大”,女子身高174,體重47公斤,想做隆胸手術被醫生勸退,醫生:她本身是A減,一心想做E杯

觀威海
2026-04-07 10:15:03
蔚來樂道L90殺到!48小時席卷全國,友商瑟瑟發抖?

蔚來樂道L90殺到!48小時席卷全國,友商瑟瑟發抖?

三農老歷
2026-04-19 22:01:29
表妹和表哥偷情大瓜:8年感情歸零,表妹不滿表哥分手曝兩人奸情

表妹和表哥偷情大瓜:8年感情歸零,表妹不滿表哥分手曝兩人奸情

江山揮筆
2026-04-18 20:54:36
交錢也炸!伊朗內斗,全球驚呆

交錢也炸!伊朗內斗,全球驚呆

思哲與創富
2026-04-20 09:59:58
48歲的老阿姨,這氣質可以打多少分

48歲的老阿姨,這氣質可以打多少分

鄉野小珥
2026-04-20 09:26:48
驚天內幕!中國專家揭露美國攻打伊朗的真正目的,竟然是這個!

驚天內幕!中國專家揭露美國攻打伊朗的真正目的,竟然是這個!

橙色書卷
2026-04-18 22:56:03
日本爆冷奪冠!朝鮮U20女足全場0進球,球員賽后黑臉拒絕握手

日本爆冷奪冠!朝鮮U20女足全場0進球,球員賽后黑臉拒絕握手

談史論天地
2026-04-19 13:52:15
“磨膝大戶”被公布,是跑步的20倍,醫生:不想軟骨磨光,早扔掉

“磨膝大戶”被公布,是跑步的20倍,醫生:不想軟骨磨光,早扔掉

垚垚分享健康
2026-04-19 14:35:09
久保建英成為首個奪得國王杯的日本球員,也是其個人生涯首冠

久保建英成為首個奪得國王杯的日本球員,也是其個人生涯首冠

懂球帝
2026-04-19 15:42:52
初中就是:抓好初一,穩住初二,盯緊初三!

初中就是:抓好初一,穩住初二,盯緊初三!

好爸育兒
2026-04-20 08:34:38
71.5%!歷史性暴跌,以貸養貸的泡沫崩了

71.5%!歷史性暴跌,以貸養貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
一夜成名!張雪的岳父登上熱搜,被麻陽當地領導邀請參加騎行活動

一夜成名!張雪的岳父登上熱搜,被麻陽當地領導邀請參加騎行活動

火山詩話
2026-04-19 17:46:25
SpaceX:受天氣影響,GPS III-8發射任務調整為4月21日

SpaceX:受天氣影響,GPS III-8發射任務調整為4月21日

界面新聞
2026-04-20 10:43:44
我媽93歲,獨居自理,她的長壽秘訣就六個字:別老想著走動!

我媽93歲,獨居自理,她的長壽秘訣就六個字:別老想著走動!

蟬吟槐蕊
2026-04-19 06:23:45
砂之船關聯企業5.78億元拍下上海閔行爛尾商業項目 擬打造亞洲最大單體奧特萊斯

砂之船關聯企業5.78億元拍下上海閔行爛尾商業項目 擬打造亞洲最大單體奧特萊斯

觀點機構
2026-04-20 09:36:06
拉夫羅夫:西方將烏克蘭推向更大范圍沖突 俄方耐心有限

拉夫羅夫:西方將烏克蘭推向更大范圍沖突 俄方耐心有限

財聯社
2026-04-19 17:41:04
被章若楠“卷發高馬尾造型”驚艷了!藍衣灰裙,盡顯青春女大感!

被章若楠“卷發高馬尾造型”驚艷了!藍衣灰裙,盡顯青春女大感!

明星私服穿搭daily
2026-04-20 10:19:01
2026-04-20 11:16:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12801文章數 142632關注度
往期回顧 全部

科技要聞

藍色起源一級火箭完美回收 客戶衛星未入軌

頭條要聞

失蹤女老板被找到 嫌犯曾改名整容還催警察"還我清白"

頭條要聞

失蹤女老板被找到 嫌犯曾改名整容還催警察"還我清白"

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

章子怡!增重20斤素顏拍新片

財經要聞

月之暗面IPO迷局

汽車要聞

外觀非常驚艷 全新一代寶馬6系有望回歸

態度原創

房產
親子
時尚
教育
軍事航空

房產要聞

官宣簽約最強城更!海口樓市,突然殺入神秘房企!

親子要聞

普通家庭養娃補鈣,90% 家長都補錯了!

今年最流行的衣服竟然是它?高級又氣質!

教育要聞

給孩子最深的滋養:一半愛護,一半需要

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關懷版