337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

滅霸帶著復聯(lián)放煙花!16秒,讓手搓 AI 視頻擁有大片即視感

0
分享至


超越 Sora 2,Vidu Q3 位居全球第二、中國第一。

作者丨王曉然

編輯丨馬曉寧


快過春節(jié)了,來整一個花活兒,想看滅霸和復仇者聯(lián)盟成員一起放煙花。

這段視頻是在 Vidu Q3 中,僅用一段 Prompt 一次生成得來,不僅能夠聲畫同步,高清直出,而且還能轉換多個鏡頭,完成一個場景敘事。

Sora 之后,AI 視頻生成在拼命卷時長。Sora 剛發(fā)布的時候,只能生成 5 秒左右的視頻,而 Vidu 最近發(fā)布了全球首個支持音視頻直出的模型 Vidu Q3 ,能實現(xiàn)16秒聲畫同出,并且敘事能力更強,在鏡頭控制、文字渲染、多國語言上都有所突破。

在國際權威AI基準測試機構Artificial Analysis最新公布的榜單中,生數(shù)科技的 Vidu Q3 憑借其在一致性、敘事性和音畫同步上的極致表現(xiàn),位居全球第二、中國第一。它不僅在評分上硬剛馬斯克的 xAI Grok,更是超越了 Runway Gen-4.5、Google Veo 3.1 和 OpenAI Sora 2,成為了領跑視頻生成下半場的關鍵變量。


在生數(shù)科技的產(chǎn)品生態(tài)中,Vidu Q3 聚焦于漫劇、短劇、影視劇行業(yè),其生成能力到底水平如何,我們用幾個 Prompt 試試就知道。

01
16s,完成宮斗劇中的一次訣別

過去,AI 視頻生成由于壓縮能力導致的一大深層痛點在于敘事斷裂,一次只能生成5-8 秒的時長,這使得生成內容更像是毫無靈魂的“素材碎片”而非邏輯完整的“敘事內容”。

基于此,創(chuàng)作者為了拼湊出一段30秒的劇情,不得不頻繁開盲盒式地生成多個素材,再面對不同批次間光影失真、人物走形、邏輯錯亂等致命傷進行后期“縫補”。

而 Vidu 不僅將單次生成時長拓展至 16 秒,更關鍵的是通過底層架構的革新,保證了這 16 秒內角色、場景、光影、聲音、畫面與敘事邏輯的高度一致性。

16 秒,在影視語言中已足以構建一個完整的敘事單元,比如一個角色從疑惑到恍然大悟的表情轉變、一次從平靜到?jīng)_突的對話交鋒,或是一個關鍵道具被揭示并引發(fā)懸念的經(jīng)典橋段。

為了驗證 Vidu Q3 「16s音視頻直出」的功力,我們重點考察它在復雜場景中能否把畫面情緒、角色對白、環(huán)境音效這幾股線自然地結合在一起。

拿最經(jīng)典的宮斗場景為例,宮斗劇對古裝場景畫面、人物情緒、固定時間內的敘事節(jié)奏要求都比較高,因此輸入的 prompt 了包含特寫、對白和具體環(huán)境音的提示詞:


生成的結果還算到位,女子眼眶泛紅、聲音凄厲顫抖的質問,與臉上滑落的淚珠完全同步,情緒是頂上去的。

背景里,窗外的風聲和遠方的喪鐘聲不是簡單的鋪底,而是隨著她話音落下才隱隱浮現(xiàn),把悲涼又壓抑的氛圍烘托了出來。對面男子冰冷的回答,其聲音等語調和畫面里他漠然的表情嚴絲合縫。

光有劇情還不夠,我們想知道它在更寫實、信息更嘈雜的環(huán)境里會如何表現(xiàn)。

因此,第二個場景來到「雨夜的倫敦火車站」,這里要求的聲音元素多且密:清晰的英語對白、突出的火車汽笛、零碎的雨打頂棚聲、還有作為背景模糊處理的廣播。


生成效果可以說是沒有瑕疵,西裝男焦急的腳步聲始終保持在最前面且十分清晰,而汽笛聲隨著火車駛進站內開始由遠及近響起,淅淅瀝瀝的雨聲很輕沒有搶戲。并且其中London 站牌的名字居然都拼對了,這個也是 Vidu Q3 的重要能力,具體測評渲染能力的案例稍后展示。

這一條視頻的細節(jié)可以說是令人驚喜的,可以見得,Vidu Q3 的聲音分層與空間感構建能力、主次音源處理能力、模擬出的真實環(huán)境混響能力都很頂。

對于節(jié)奏極快、音畫切換頻繁的現(xiàn)代音樂內容,我們采用圖生視頻的方式測試紐約街頭的說唱。


結果生成的視頻讓人很有代入感,rapper 激昂的說唱嘴型與鼓點、貝斯的節(jié)奏卡得非常準,每個重音都砸在了剪輯點上。鏡頭在手勢、表情和面部特寫間的快速切換,也完美踩在了音樂的律動上。

02
大師級運鏡,短劇中巴掌扇得更絲滑

AI視頻生成中,最常遇到的一個穿幫點就是鏡頭語言。

許多模型能生成一段幾秒的穩(wěn)定畫面,但一旦涉及鏡頭切換、視角轉換、景別變化,問題就會出現(xiàn)??赡茉谶\鏡過程中出現(xiàn)畫面主體扭曲、場景撕裂,更常見的是,多鏡頭之間缺乏敘事節(jié)奏和情緒連貫性,看起來像幾段獨立視頻的生硬拼接。

可以說,「多鏡頭運鏡」是區(qū)分「會動的畫」和「有敘事感的視頻」的核心能力,它考驗的是模型對空間連續(xù)性、時間邏輯和視覺敘事語法的綜合理解。

先測試看一個快節(jié)奏短劇中的鏡頭切換,選用短劇中常見的咖啡廳決裂戲碼:


這個片段最驚艷的地方在于節(jié)奏感抓得很準很舒服。特寫鏡頭里戒指的反光細節(jié)很真實,切到近景時,男士說話的口型跟臺詞對得很嚴,女士站起來后的頭發(fā)的飄動很自然,扇巴掌的動作、聲音也足夠絲滑。

接下來測試最考驗節(jié)奏感的動作場景。提示詞明確要求了“特寫→遠景→中景”的快速切換。


整個片段可以說是一氣呵成了。特寫鏡頭中驚恐的雙眼和汗珠極具張力;切至遠景時,黑影在巷尾的閃動自然且位置連貫;切回中景時,主角朝向鏡頭的奔跑與之前的空間關系完全吻合。

更出色的是,音效與鏡頭實現(xiàn)了精準配合:特寫時喘息聲很近,切遠景時聲音隨之拉遠并突出腳步回聲,切回中景時喘息聲再次迫近。

第二個場景側重視角轉換,第一人稱→全景→特寫,也伴隨氛圍變化的運鏡。


從實際表現(xiàn)來看,切換到鏡頭二的全景時,人物與石門的巨大比例對比震撼,且視角轉換無比自然,沒有出現(xiàn)「跳幀」或場景重置;鏡頭三對石門圖騰的特寫,可以看作是全景鏡頭的自然推進與聚焦。

03
渲染能力出色,漫劇輕松拿捏

對于生成式 AI 視頻而言,能否穩(wěn)定、精準地生成與畫面風格融合的文字,往往是其能否勝任“專業(yè)級制作”的硬性門檻。

過往很多模型在渲染文字時,容易出現(xiàn)筆畫錯亂、字符閃爍、風格撕裂,或者與畫面光影嚴重不符的情況,這使得生成的內容很難直接用于對細節(jié)有要求的商業(yè)短片、漫劇或劇情向內容。

Vidu Q3 具有較強的文字渲染能力,可精準渲染中、英、日三種文字。先從一個相對靜態(tài)但要求極高的場景開始:產(chǎn)品展示,要求生成一架無人機,機翼上需清晰呈現(xiàn)具有金屬蝕刻感的英文「Vidu Q3」。


效果表現(xiàn)中,無人機的極簡設計感十足,而機翼側面的“Vidu Q3”字樣并非簡單“貼”上去,而是真正模擬出了金屬蝕刻的質感和深度。隨著無人機緩緩旋轉,文字表面的反光與外殼一同折射出細膩的夕陽余暉,光影變化自然統(tǒng)一。

接下來,挑戰(zhàn)一下風格化與動態(tài)渲染:一個熱血日漫風格的場景,包含動態(tài)的日語喊話。


這個案例綜合展示了 Vidu Q3 的綜合能力,一是對特定藝術風格(日漫)的精準把握,二是在極限動態(tài)場景中,保持畫面、音效超高同步性與表現(xiàn)力。

最后測試一個充滿張力的古裝武俠場景,包含中文對白和激烈的動作戲。


Vidu Q3 的這個畫面美感是超出預期。在激烈的武打動作中,能夠很好地保持畫面的穩(wěn)定和連貫,證明了其對中文對白字幕的專業(yè)化處理能力,并且在這一效果中,字幕成為了增強敘事沉浸感的一部分,而非后期生硬的添加。這種生成程度已經(jīng)可以應用于短劇、漫劇制作等場景中了。

04
結語

2024 年,AI 視頻生成行業(yè)嶄露頭角,經(jīng)過兩年時間的發(fā)展,整個行業(yè)則會向更成熟的方向發(fā)展。

Vidu Q3 的意義不僅僅在于“16秒的音視頻直出”和“中國第一”,也許其更廣泛的意義在于,在降低視頻制作門檻的同時還增加了精準的控制程度。

「控制」二字似乎從未遠離過影視制作行業(yè),從演員對神態(tài)、語言的控制,到導演對畫面、風格的控制,再到到攝影師對鏡頭、畫面的控制,這是貫穿視頻制作始終的二字。

而要實現(xiàn)內容的完美呈現(xiàn)和控制,過去這需要包括導演、攝影師、后期特效等一個專業(yè)團隊反復打磨才能精準實現(xiàn)。

現(xiàn)在來看,Vidu Q3 能讓專業(yè)的內容創(chuàng)作者直接“調度”角色姿態(tài)、運鏡方式、場景細節(jié)乃至情緒氛圍,實現(xiàn)精細化的“導演級”控制,腦海中抽象的創(chuàng)意可以快速、精準地轉化為高質量的視頻片段。

除此之外,影視行業(yè)中常常受限于實拍成本、演員檔期、特效預算或特殊場地。這些傳統(tǒng)的問題也能被有效彌合,Vidu Q3 極大地降低了高質量視覺內容的制作門檻,作者可以無成本地生成現(xiàn)實中難以拍攝或造價高昂的場景。

不僅如此,Vidu Q3 讓普通的門外漢,也能制作出有審美、有品味的大片。回想當時抖音的出現(xiàn),降低了人們進行內容表達的門檻,讓即使受教育程度不高的人,只需點一下「錄制」的圓形按鈕,就能自由地使用視頻這種去表達自己的觀點和內容。

而如今的Vidu Q3正在做著類似的事情。 Vidu Q3 不再是束之高閣的AI玩具,而是有能力真正深入到了漫劇、短劇、影視劇的制作核心。

Vidu Q3體驗地址:https://www.vidu.cn

Vidu API地址:https://platform.vidu.cn

登陸 Vidu.cn 注冊,使用 AI 科技評論邀請碼:AIKJPL,即可獲得500積分。

未經(jīng)「AI科技評論」授權,嚴禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
2026年演唱會門票最貴的10位歌手排行榜,第一名歌手竟是一位老登

2026年演唱會門票最貴的10位歌手排行榜,第一名歌手竟是一位老登

陳意小可愛
2026-03-20 00:29:08
中共一大13代表命運:4犧牲3叛變僅2人堅持革命成功

中共一大13代表命運:4犧牲3叛變僅2人堅持革命成功

優(yōu)趣紀史記
2026-03-21 22:24:02
申軍良回應“梅姨”落網(wǎng):我找了她10年,在她住過的村子挨家打聽,幾次差點把命搭進去,不找到她這輩子不甘心

申軍良回應“梅姨”落網(wǎng):我找了她10年,在她住過的村子挨家打聽,幾次差點把命搭進去,不找到她這輩子不甘心

極目新聞
2026-03-21 17:23:19
以方:伊朗權力核心人物被擊斃!

以方:伊朗權力核心人物被擊斃!

Nee看
2026-03-17 16:48:23
這次網(wǎng)紅“吃瓜蒙主”的號真沒了,或因其傳播的歷史虛無主義言論

這次網(wǎng)紅“吃瓜蒙主”的號真沒了,或因其傳播的歷史虛無主義言論

總在茶余后
2026-03-20 02:14:25
郭富城沒想到,生三胎僅4個多月,方媛會這樣打出一副“王炸”

郭富城沒想到,生三胎僅4個多月,方媛會這樣打出一副“王炸”

老頭的傳奇色彩
2026-03-20 07:54:02
伊朗已無官員愿意與美國談判

伊朗已無官員愿意與美國談判

財聯(lián)社
2026-03-20 23:57:04
奇怪的現(xiàn)象:你跟任何人交往,一旦你聽話照做,對方就會看不上你

奇怪的現(xiàn)象:你跟任何人交往,一旦你聽話照做,對方就會看不上你

木言觀
2026-03-14 06:54:14
中東已殺紅眼?以色列炸氣田捅破天,油價破110特朗普急甩鍋認慫

中東已殺紅眼?以色列炸氣田捅破天,油價破110特朗普急甩鍋認慫

尋墨閣
2026-03-21 16:28:49
港口無人接盤,20億索賠難承受,巴總統(tǒng)倒打一耙,把裝傻進行到底

港口無人接盤,20億索賠難承受,巴總統(tǒng)倒打一耙,把裝傻進行到底

奇思妙想生活家
2026-03-21 19:49:27
新版 iOS 微信正式發(fā)布,藏5大實用新功能

新版 iOS 微信正式發(fā)布,藏5大實用新功能

小8說科技
2026-03-22 00:54:12
為了拿下湖人球星東契奇,詹娜究竟付出了多大代價?

為了拿下湖人球星東契奇,詹娜究竟付出了多大代價?

羅氏八卦
2026-03-21 18:00:03
廣州偶遇陳偉霆鐘楚曦拍戲,鐘楚曦這發(fā)簪一挽,氛圍感直接封神

廣州偶遇陳偉霆鐘楚曦拍戲,鐘楚曦這發(fā)簪一挽,氛圍感直接封神

趕山的姑娘
2026-03-20 08:17:00
“媽寶男”朱雨辰:錯過湯唯又負姜妍,被母愛禁錮47年,至今未婚

“媽寶男”朱雨辰:錯過湯唯又負姜妍,被母愛禁錮47年,至今未婚

趣味八卦
2026-03-22 02:48:42
“漿果兒”事件回顧:200名女主角,拍攝17部視頻,內容不堪入目

“漿果兒”事件回顧:200名女主角,拍攝17部視頻,內容不堪入目

就一點
2026-03-16 00:02:36
炸穿天際!伊朗再出王炸,美國被坑慘了!

炸穿天際!伊朗再出王炸,美國被坑慘了!

大嘴說天下
2026-03-21 20:55:08
當年恒大冰泉鋪滿超市,許家印都可以和農(nóng)夫山泉掰手腕,為何大敗

當年恒大冰泉鋪滿超市,許家印都可以和農(nóng)夫山泉掰手腕,為何大敗

小武侃風云
2026-03-19 01:59:23
山河四省開通地鐵情況:山東路線廣里程數(shù)多,河南開通城市真不少

山河四省開通地鐵情況:山東路線廣里程數(shù)多,河南開通城市真不少

西莫的藝術宮殿
2026-03-22 02:04:45
8類人最易患阿爾茨海默病:蛋白質不足加速大腦衰老!攝入量指南

8類人最易患阿爾茨海默?。旱鞍踪|不足加速大腦衰老!攝入量指南

羅夕夕博士
2026-03-20 22:10:44
張凌赫憑《逐玉》成95生第1人,最該感謝的竟是“拒演”的他?

張凌赫憑《逐玉》成95生第1人,最該感謝的竟是“拒演”的他?

阿廢冷眼觀察所
2026-03-21 16:40:33
2026-03-22 04:24:49
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7134文章數(shù) 20742關注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機器人出貨量第一!

頭條要聞

伊朗發(fā)射3800公里射程的導彈 最令美軍戰(zhàn)栗的細節(jié)披露

頭條要聞

伊朗發(fā)射3800公里射程的導彈 最令美軍戰(zhàn)栗的細節(jié)披露

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經(jīng)要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態(tài)度原創(chuàng)

數(shù)碼
家居
房產(chǎn)
手機
公開課

數(shù)碼要聞

炸鍋!國產(chǎn)存儲芯片再突破!手機固態(tài)價格大跳水,內存自由要來了

家居要聞

時空交織 空間綺夢

房產(chǎn)要聞

全城狂送1000杯咖啡!網(wǎng)易房產(chǎn)【早C計劃】,即刻啟動!

手機要聞

終端市場集體喊“漲” 手機面板持續(xù)走“跌”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版