![]()
AI還需要與現(xiàn)實(shí)世界縫合
文/林書
編輯/劉宇翔
雖然成本并非3000元,那只是AI算力成本,但AI短片《霍去病》還是讓影視從業(yè)者們,感到了陣陣寒意。
看報(bào)價(jià)便知,《霍去病》制作團(tuán)隊(duì)向媒體提供的報(bào)價(jià)單顯示,其商業(yè)視頻每秒100-500元,影視視頻每秒100-300元,CG建模類視頻每秒300-1000元,1分鐘影視短片最低成本僅6000元。而常規(guī)短劇單集制作成本5萬元左右,特效鏡頭普遍3000元/秒的CG報(bào)價(jià)。也就是說用AI制作短劇,成本不足傳統(tǒng)影視的十分之一。
這是連短劇領(lǐng)域的“鄭州幫”都難以企及的成本優(yōu)勢(shì)。至于效果,對(duì)于短劇平臺(tái)來說,短劇不過是消耗用戶時(shí)間,以方便植入廣告的消耗品。消耗品比起質(zhì)量,更在乎數(shù)量,海量的AI短劇灌入,用戶的偏好也很可能因此改變。
既然推薦算法“馴服”了用戶的習(xí)慣,AI制作也能改變用戶的審美。這讓整個(gè)影視圈宛如手持著冷兵器,面對(duì)鋪天蓋地而來的“機(jī)械章魚”,《黑客帝國(guó)》般的場(chǎng)景。
一開始所有人都沒意識(shí)到改變會(huì)來得那么快,春節(jié)前,就在短劇劇組、公司經(jīng)歷了一整年紅利,興致勃勃準(zhǔn)備開年再接再厲時(shí),快手在2月4日連夜發(fā)布可靈3.0系列,字節(jié)跳動(dòng)的Seedance 2.0在2月7日開啟小范圍內(nèi)測(cè),宣傳片里,那些畫面流暢、光影考究的片段,看得人心潮澎湃。
只要敲幾行字,AI就能把腦中的畫面變成短劇,整個(gè)影視生產(chǎn)底層邏輯被重構(gòu)了,劇本生成、角色建模、畫面渲染、配音配樂等全流程均可通過AI工具完成。行業(yè)數(shù)據(jù)顯示,AI特效成本已壓縮至傳統(tǒng)模式的5%-20%。曾經(jīng)以技術(shù)、資金構(gòu)筑的影視工業(yè)化門檻,被輕易擊垮。
一位廣告公司朋友告訴我們,過去拍宣傳片,需要找編劇、導(dǎo)演、演員,租場(chǎng)地、設(shè)備,請(qǐng)剪輯、包裝、配音,來來回回溝通。但現(xiàn)在輸入創(chuàng)作需求,幾小時(shí)就能出片,成本還不到原來的三分之一。
我的幾位影視圈朋友心態(tài)更是復(fù)雜的,因募資不足賦閑已久的出品人興高采烈躍躍一試,剪輯師已經(jīng)好久沒能接單,編劇朋友更是早就用AI寫劇本。“傳統(tǒng)”從業(yè)者們被迫應(yīng)對(duì)時(shí),有AI加持的普通創(chuàng)業(yè)者與個(gè)人創(chuàng)作者反而涌入行業(yè),進(jìn)一步殺低報(bào)價(jià)。
似乎有了AI,人人皆可當(dāng)導(dǎo)演,人人皆可拍劇了。影視創(chuàng)造的城門已經(jīng)洞開。
老實(shí)說,我一開始也是信了的。
01
前幾天下午,我滿懷期待地打開了這兩個(gè)工具,然而,實(shí)際的體驗(yàn),卻讓我打破了很多對(duì)當(dāng)下視頻AI的“幻想”。
在以下測(cè)試中,上方的視頻均為可靈3.0,下方均為Seedance 2.0。
最開始測(cè)試的,是復(fù)雜場(chǎng)景的理解力。
以下面這段視頻為例,我輸入的提示詞是:
“一對(duì)男女在咖啡館里交談,女子問男子:你相信嗎?其實(shí)我們都是AI,這個(gè)世界也都是模擬出來的,男子表示難以置信,之后,女子示意男子一起隨她走出咖啡館,兩人走出后,發(fā)現(xiàn)外面是一片黃沙肆虐的廢土,原先的高樓全都變成了廢墟。”
視頻詳見鏈接:https://mp.weixin.qq.com/s/Lh2qAL2m5_SwPyU8Ez0Elg
講真,可靈似乎沒能準(zhǔn)確get到我的意圖,視頻中,咖啡廳外的景象出現(xiàn)了詭異的漂移,最后高樓轉(zhuǎn)成廢墟的場(chǎng)景,也顯得有些突兀。
相較之下,Seedance 2.0的表現(xiàn)就自然了些許,不僅人物的神色拿捏得較為到位,并且在走出咖啡廳時(shí),也展現(xiàn)了“出門”這一動(dòng)作,而不是生硬地轉(zhuǎn)場(chǎng);
之后,我分別測(cè)試了二者在理解物理規(guī)律上的表現(xiàn)。
這方面,Seedance 2.0和可靈3.0,可謂半斤八兩。
首先看可靈的表現(xiàn):
提示詞:一個(gè)燒紅的鐵球掉落在一大塊透明冰塊上。撞擊時(shí),冰塊逼真地裂開,蒸汽瞬間升起,球體在冰上熔化出一個(gè)小坑,同時(shí)產(chǎn)生蜘蛛網(wǎng)狀的裂紋。水在撞擊點(diǎn)周圍積聚。
從視頻中的效果來看,鐵球撞上的似乎是某種很脆的,易碎的固體,而非遇熱即熔的冰塊,冰塊也并未因與灼熱鐵球的接觸,而發(fā)生凹陷。
Seedance 2.0在音色方面的表現(xiàn)略出色了些,出現(xiàn)了冒煙的滋滋聲,冰塊的融化聲,但冰塊仍然沒有凹陷。
這說明二者在物理規(guī)律方面,仍然在靠數(shù)據(jù)和樣本在模仿,而并非真正理解現(xiàn)實(shí)的物理規(guī)律。
之后,則是一段比較“人間”的物理性測(cè)試:
提示詞:一輛載著10個(gè)高高疊起的不穩(wěn)定披薩盒的送餐摩托車在街上飛馳。摩托車突然急剎車。車停了,但披薩盒堆因慣性逐個(gè)倒塌,最后掉落在路面上
這段案例,因?yàn)椴幌袂懊娴蔫F球撞冰塊那樣,對(duì)物理規(guī)律有著嚴(yán)苛的要求,這方面的視頻,因?yàn)橛休^多素材訓(xùn)練,因此二者表現(xiàn)尚可,都展現(xiàn)了披薩因慣性掉落的畫面,
區(qū)別是可靈的表現(xiàn)似乎更有“鏡頭感”一些,還展示了披薩掉落后的些許細(xì)節(jié)。
最后,我腦洞大開,拍了個(gè)穿越劇的片段,讓古代士兵用機(jī)槍戰(zhàn)斗,并被手雷反殺的劇情:
講真,這段視頻中,Seedance 2.0在多圖控制上的優(yōu)勢(shì)體現(xiàn)了出來,雖說還有小BUG,但已經(jīng)比較完整地體現(xiàn)了整個(gè)劇情。
相較之下,可靈的效果則很不盡人意,盡管上傳了相同的配圖,但人物還是出現(xiàn)了嚴(yán)重的變形,并且士兵掃射的方向也完全搞反了。
以上展示的片段,只是我在試用過程中,做出的真正“能看”的成果。
而相當(dāng)一部分的時(shí)間、積分和算力,都消耗在了“抽卡”上。
可靈的會(huì)員是60塊錢一個(gè)月,送1800積分。生成一段15秒視頻,消耗180積分,也就是一個(gè)月大約10個(gè)視頻。
但問題是,“抽卡”是不保證質(zhì)量的。你可能生成十段,只有兩段勉強(qiáng)能用。
那天下午,我把半個(gè)月的積分都揮霍完了,最后只得到兩三個(gè)勉強(qiáng)滿意的視頻——離可直接交付的影視級(jí)標(biāo)準(zhǔn),還差得遠(yuǎn)。
為了提高成功率,我開始嘗試多圖控制——就是先讓AI畫幾張關(guān)鍵幀的圖,再讓視頻模型參考這些圖生成視頻。
但很快我又撞上了另一堵墻:AI繪圖本身也需要抽卡。
我讓AI畫一張“窗外正在下雨的咖啡館”,它要么把雨畫在咖啡館里,要么把窗戶畫成透明的墻壁。
更痛苦的是,由于最近Seedance 2.0 爆火,字節(jié)服務(wù)器似乎壓力頗大,在我測(cè)試時(shí),一段15秒的視頻,居然提示要排6個(gè)小時(shí)的隊(duì),這直接勸退了我后續(xù)的制作。
![]()
那一刻,我突然意識(shí)到一件事。
我原本以為,AI工具能幫我省掉那些最昂貴的、消耗時(shí)間的環(huán)節(jié)——找場(chǎng)地、搭景、調(diào)燈光、等演員。但現(xiàn)在呢?場(chǎng)地不用找了,但我得花七個(gè)小時(shí)排隊(duì);燈光不用調(diào)了,但我得花一下午抽卡賭運(yùn)氣。
就這樣,整整一個(gè)下午,我大部分時(shí)間都耗在了排隊(duì)和抽卡里。
02
那天下午折騰完之后,我并沒有覺得憤怒。更多的是一種奇怪的疲倦——不是因?yàn)樽隽颂嗍拢且驗(yàn)槭裁词露紱]做成,卻已經(jīng)很累了。
這種感覺從哪里來的?我試著把它拆開來看。
做視頻這件事,不管用什么工具,本質(zhì)上都有無形的、瑣屑的步驟在消耗你——傳統(tǒng)拍攝有傳統(tǒng)拍攝的消耗:找場(chǎng)地、約演員、搭景、調(diào)光、返工等等。
這樣的消耗,正是視頻制作環(huán)節(jié)中的“摩擦力”。
AI工具出現(xiàn)之前,這些摩擦力是“可見”的:你知道找場(chǎng)地要花多少錢,知道約演員要等多久。它們明碼標(biāo)價(jià),你可以算賬、預(yù)判、接受。
AI工具出現(xiàn)之后呢?乍一看,那些摩擦力消失了。不用找場(chǎng)地了,不用約演員了。但那天下午的經(jīng)歷告訴我:它們并沒有消失,只是換了一副面孔。
顯性摩擦力,變成了排隊(duì)時(shí)間和生成費(fèi)用。Seedance 2.0服務(wù)器爆掉的那七個(gè)小時(shí),時(shí)間是真實(shí)消耗的。可靈的積分消耗是另一種形式的錢:生成一段15秒視頻要耗掉180積分,效果不理想不會(huì)退給你。你付的是"可能"的錢,不是"確定"的錢。
![]()
隱性摩擦力,變成了抽卡成本和學(xué)習(xí)成本。本質(zhì)上,這是“導(dǎo)演換成了AI模型”、“溝通換成了提示詞博弈”。
上游摩擦力,從“找演員”變成了“生成參考圖”。 為了讓視頻效果更可控,需要先用AI繪圖生成關(guān)鍵幀。但AI繪圖本身也有摩擦力——你讓它畫一張窗外在下雨的咖啡館,它可能把雨畫進(jìn)咖啡館里——目前某些最“先進(jìn)”的繪圖模型,現(xiàn)在仍然在犯這種低級(jí)錯(cuò)誤。
這就是我那天撞上的“控制悖論”:為了降低視頻生成的摩擦力,你需要先承受圖像生成的摩擦力。摩擦力沒有消失,它只是被推到了上游。
更麻煩的是,這種變形讓摩擦力從“可見”變成“隱形”,從“指導(dǎo)-改進(jìn)”變成“混沌-靠運(yùn)氣”。傳統(tǒng)拍攝的摩擦力是一錘子買賣:場(chǎng)地租了、演員付了,后面就是拍。AI工具的摩擦力是持續(xù)性的:每一次生成都有失敗的可能,你永遠(yuǎn)不知道這次要花多少錢、多長(zhǎng)時(shí)間。
當(dāng)摩擦力是可見的,人會(huì)本能地去對(duì)抗它。但當(dāng)摩擦力變成隱形的,人就會(huì)陷入一種莫名的消耗——不知道在哪里出了問題,只知道結(jié)果不盡如人意。
這不是AI工具不好,這是摩擦力在換了一副面孔之后,更難被察覺,也更難被抵消。
03
但我必須說公道話。那天的失敗經(jīng)歷是真實(shí)的,但它不是全部的真相。
2025年末,一部叫《斬仙臺(tái)AI真人版》的短劇,6天內(nèi)播放量破億。制作方12人團(tuán)隊(duì),周期30天,算力成本10萬元。同等體量的傳統(tǒng)短劇需要40到60人,成本60萬以上,另一個(gè)案例就是《霍去病》,23分鐘,算力成本據(jù)說是3000元,播放量據(jù)稱有5億。
同樣的工具,為什么結(jié)果差距這么大?
答案其實(shí)不復(fù)雜。這就是杠桿原理:杠桿能省力,前提是支點(diǎn)位置正確。
![]()
這個(gè)行業(yè)找到的"最佳支點(diǎn)",叫做"縫合模式"。
邏輯很簡(jiǎn)單:AI做特效,真人演文戲,最后剪輯合成。傳統(tǒng)短劇做不起特效,是因?yàn)镾級(jí)別特效單分鐘成本要1.5萬到4萬元。但AI生成的特效,單分鐘成本已經(jīng)壓縮到1300元,最低能到400元,這不是一個(gè)數(shù)量級(jí)的差距。
AI讓短劇“用得起特效了”——這才是這個(gè)工具的核心價(jià)值。不是替代人,而是把過去“負(fù)擔(dān)不起”的部分,變成“負(fù)擔(dān)得起”。
這個(gè)邏輯,用杠桿來理解再貼切不過了:AI是杠桿的一端,真人制作是另一端,特效鏡頭是支點(diǎn)。 把AI放在特效這個(gè)支點(diǎn)上,它以最小的成本撬動(dòng)了過去需要大量金錢才能實(shí)現(xiàn)的畫面效果。
市場(chǎng)印證了這一點(diǎn)。2025年被稱為“AI漫劇元年”,全年播放量突破700億,上線漫劇46931部。約60%到70%的漫劇使用AI輔助生成,但純AI生成占比不到10%——這說明,市場(chǎng)不是在用AI替代人,而是在用AI做人做不了的部分。
但這里有一個(gè)前提:這個(gè)杠桿效應(yīng),是有條件的。
《斬仙臺(tái)》能做到那個(gè)效果,是因?yàn)?2人團(tuán)隊(duì)已經(jīng)跑通了“AI+真人縫合”的完整工作流——前期AI生成角色形象和場(chǎng)景概念圖,中期真人演員拍攝文戲,后期AI生成特效鏡頭,人工剪輯合成。每個(gè)環(huán)節(jié)都有人負(fù)責(zé),每個(gè)人都知道自己該做什么,容錯(cuò)空間可以被分?jǐn)偟秸麄€(gè)流程里。
所以,AI視頻工具并沒有“降低門檻”。更準(zhǔn)確的表述是:它把門檻從“有沒有資源”變成了“有沒有工作流”。
你不再需要60個(gè)人和60萬塊錢,但你需要一套成熟的分工體系,學(xué)會(huì)“縫合”。這個(gè)認(rèn)知本身,就是一道新的門檻。
04
現(xiàn)在回到那兩個(gè)工具本身,以及它們背后的兩家公司。
Seedance和可靈雖然亮眼,但目前仍掩蓋不了字節(jié)、快手在AI創(chuàng)作應(yīng)用商業(yè)閉環(huán)上的焦慮。
2025年可靈AI全年收入約10億人民幣(1.4億美元),2025年全年Capex(資本性開支)指引上調(diào)至140億元,主要用于可靈AI和廣告技術(shù),10億收入 vs 140億投入,可靈的收入連投入的零頭都不到。
字節(jié)這邊,更是無從對(duì)照:字節(jié)2025年整體AI資本開支1500億元,2026年計(jì)劃1600億元,Seedance至今沒有公開的商業(yè)化營(yíng)收數(shù)字;
所以,對(duì)二者來說,短劇和漫劇真的是“救命稻草”嗎?
我的判斷是:不是。
因?yàn)锳I漫劇、短劇有幾個(gè)結(jié)構(gòu)性隱患。
首先,爆款難以復(fù)制,且用戶審美疲勞極快。2026年數(shù)據(jù)顯示,AI漫劇的爆款率已經(jīng)下滑到1%——100部里只有1部能真正出圈。這個(gè)比例還在下降,因?yàn)楣┙o在爆炸式增長(zhǎng),僅2025年抖音端原生漫劇上線數(shù)量就突破了6萬部。
![]()
其次,雖然所有視頻內(nèi)容都消耗用戶時(shí)間,但短劇的時(shí)間消耗直接決定收入上限,而廣告/電商的時(shí)間消耗只是“效果變量”。短劇市場(chǎng)受限于C端的錢包和時(shí)間,廣告/電商市場(chǎng)受限于B端的預(yù)算——后者可擴(kuò)展,前者是物理常數(shù)。
一個(gè)廣告視頻可能被100萬人看,也可能被1萬人看,但企業(yè)關(guān)心的是轉(zhuǎn)化率和ROI。
所以,更大的戰(zhàn)場(chǎng)在別處。電商廣告領(lǐng)域,AI混剪素材制作成本降低95%,視頻產(chǎn)量提升700%。品牌營(yíng)銷、文旅、教育、游戲,這些場(chǎng)景對(duì)視頻的需求量遠(yuǎn)大于短劇。
現(xiàn)階段快手和字節(jié)燒的錢,實(shí)際上是在為兩三年后的廣告和電商AI化買票——短劇、漫劇只是驗(yàn)證工具能力的試驗(yàn)田,不是終局。
這個(gè)大盤子有多大?2025年中國(guó)互聯(lián)網(wǎng)營(yíng)銷市場(chǎng)規(guī)模約8818億元,移動(dòng)廣告市場(chǎng)約4867億元。AI視頻哪怕只滲透其中5%,就是400億以上的市場(chǎng)。這會(huì)是快手和字節(jié)開辟的新市場(chǎng),而不只是短劇。
更進(jìn)一步地說,如果Seedance、可靈能成為行業(yè)標(biāo)準(zhǔn)工具,未來的變現(xiàn)空間就不止是短劇和廣告素材,而是所有需要視頻內(nèi)容的場(chǎng)景——包括游戲、影視、教育、企業(yè)服務(wù)。
但二者面臨同一個(gè)核心挑戰(zhàn):如何把摩擦力降到用戶感知不到的程度。
可靈的抽卡機(jī)制、Seedance的排隊(duì)問題,本質(zhì)上都是視頻生成中的“摩擦力”問題。
AI視頻創(chuàng)作的未來,不是讓一個(gè)人變成一個(gè)團(tuán)隊(duì),而是讓工具變成一種能力,穩(wěn)定、可控、可預(yù)期,隨手可調(diào)用。當(dāng)摩擦力從“看不見的負(fù)擔(dān)”變成“感知不到的存在”,就意味著AI創(chuàng)作能力、算力成本被攤薄到基礎(chǔ)設(shè)施使用成本的地步。
我不敢想象那會(huì)是何等的情景,是人創(chuàng)造力被極大釋放,還是會(huì)活在“黑鏡”之中。
那真會(huì)是非常充滿戲劇性張力的一幕。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.