![]()
內(nèi)容|Max
編輯|Max
過(guò)去的一兩年里,AI生成視頻的浪潮幾乎席卷了每一個(gè)內(nèi)容平臺(tái)。
那些畫(huà)面精美、轉(zhuǎn)場(chǎng)華麗的AI短片和商業(yè)TVC,總會(huì)給人一種技術(shù)已經(jīng)無(wú)所不能的錯(cuò)覺(jué)。
但只要你真正下場(chǎng)制作過(guò)一條哪怕只有幾十秒的AI視頻,就會(huì)體會(huì)到一種難以言喻的疲憊與割裂:
你需要在一堆網(wǎng)頁(yè)間來(lái)回跳轉(zhuǎn),用語(yǔ)言大模型寫(xiě)腳本,去圖像平臺(tái)反復(fù)抽卡定角色,再把拆盲盒般得到的動(dòng)態(tài)片段塞進(jìn)剪輯軟件里縫縫補(bǔ)補(bǔ)。
在這個(gè)看似前衛(wèi)的創(chuàng)作流程中,人類(lèi)創(chuàng)作者其實(shí)更像是穿梭在不同系統(tǒng)間搬運(yùn)數(shù)據(jù)、修補(bǔ)BUG的流水線工人。
哪怕只是想把主角衣服的顏色換一下,整個(gè)流程可能都要全盤(pán)推翻重來(lái)。
創(chuàng)作的靈感和激情,往往就在這種漫長(zhǎng)且無(wú)意義的跨平臺(tái)消耗中消磨殆盡了。
我們習(xí)慣性地期盼著某個(gè)界面更簡(jiǎn)單的軟件出現(xiàn),好讓人類(lèi)點(diǎn)鼠標(biāo)的時(shí)候能輕松一些。
直到前段時(shí)間,我受邀參與了LiblibAI籌備已久的神秘項(xiàng)目?jī)?nèi)測(cè),我才意識(shí)到,過(guò)去行業(yè)的解題思路可能全錯(cuò)了——我們?yōu)槭裁捶且m結(jié)于讓人類(lèi)去適應(yīng)軟件?
既然AI已經(jīng)進(jìn)化出了理解與執(zhí)行的能力,為什么不能給AI開(kāi)一扇門(mén),讓Agent(智能體)自己去操控軟件?
直到2026年3月18日,這款名為 LibTV 的產(chǎn)品正式發(fā)布。
![]()
在深度使用了幾天之后,我可以給出一個(gè)相對(duì)客觀的結(jié)論:
它是現(xiàn)階段市面上最適合專(zhuān)業(yè)創(chuàng)作者的AI視頻工具。
這不僅僅是因?yàn)樗闪水?dāng)下最頂級(jí)的模型算力,更是因?yàn)樗嵏残缘夭捎昧穗p入口設(shè)計(jì)。
它不僅為人類(lèi)提供了一個(gè)用來(lái)統(tǒng)籌全局的無(wú)限畫(huà)布,更是世界上首個(gè)原生為Agent(比如小龍蝦OpenClaw、Claude Code等)提供專(zhuān)屬控制接口(Skill)的視頻創(chuàng)作平臺(tái)。
當(dāng)我在內(nèi)測(cè)中,看著我的Agent(龍蝦)在微信里自動(dòng)根據(jù)我給的腳本去生成一只完美的視頻后,我感受到了一種復(fù)雜的平靜。
這也是我寫(xiě)下這個(gè)標(biāo)題的原因:
當(dāng)一款為Agent設(shè)計(jì)的平臺(tái)真正出現(xiàn),當(dāng)繁雜的執(zhí)行工作被機(jī)器徹底接管,剝?nèi)ニ屑夹g(shù)壁壘的偽裝后。
人類(lèi)創(chuàng)作者最后能握在手里的底牌,大概真的只剩下審美了。
PART.01人類(lèi)在LibTV:無(wú)限畫(huà)布
THUMBSTOPPING
在討論Agent之前,我們有必要先審視一下人類(lèi)在LibTV里的操作界面。
長(zhǎng)久以來(lái),AI視頻工具的界面大多是一條線性的時(shí)間軸,或者干脆就是一個(gè)簡(jiǎn)單的對(duì)話框。
創(chuàng)作者把提示詞扔進(jìn)去,剩下的全憑運(yùn)氣。
![]()
LibTV放棄了這種開(kāi)盲盒式的交互,它給人類(lèi)創(chuàng)作者提供的是一塊無(wú)限延展的畫(huà)布。
在這塊畫(huà)布上,文本、腳本、圖片、視頻、音頻這五種基礎(chǔ)節(jié)點(diǎn)被具象化了。
它們不再是散落在電腦各個(gè)文件夾里的孤立素材,而是可以通過(guò)連線相互咬合的齒輪。
你可以清晰地看到一條工作流是如何建立的:
左邊的角色設(shè)定文本,連線生成了中間的角色三視圖,再向下延展出多條不同機(jī)位的分鏡視頻,旁邊還掛著全局的旁白與配樂(lè)。
![]()
對(duì)于普通用戶(hù)來(lái)說(shuō),復(fù)雜的節(jié)點(diǎn)連線或許會(huì)帶來(lái)一定的認(rèn)知門(mén)檻,但對(duì)于專(zhuān)業(yè)的影視從業(yè)者而言,這種系統(tǒng)級(jí)的復(fù)雜度恰恰是他們一直渴望的武器。
在內(nèi)測(cè)中,LibTV展現(xiàn)出了一種對(duì)影視工業(yè)常識(shí)的尊重。
比如,過(guò)去我們控制畫(huà)面,只能在提示詞里堆砌電影感、側(cè)光、85mm鏡頭這樣含糊的詞匯。
而LibTV直接在界面里映射了物理世界的攝像機(jī)與燈光系統(tǒng)。
你可以像操作真實(shí)的單反一樣去調(diào)整焦距與光圈,或者拖動(dòng)虛擬的光球,給畫(huà)面加上一個(gè)右側(cè)50%亮度的輪廓光。
![]()
它甚至引入了傳統(tǒng)劇組里的場(chǎng)面調(diào)度邏輯——你可以用一句話生成9宮格或25宮格的機(jī)位推演圖。
當(dāng)你發(fā)現(xiàn)某一個(gè)俯拍視角的構(gòu)圖恰到好處時(shí),直接使用網(wǎng)格切分功能將那一格提取出來(lái),作為下一個(gè)鏡頭的視覺(jué)錨點(diǎn)。
結(jié)合強(qiáng)制鎖定人物特征的角色三視圖功能,AI視頻最讓人頭疼的連貫性問(wèn)題,終于在工作流的源頭得到了系統(tǒng)性的控制。
在內(nèi)測(cè)期間,我看到一位名叫畢加索隆的創(chuàng)作者利用這套畫(huà)布完成了短片《索拉里斯之船》。
在極其繁雜的節(jié)點(diǎn)網(wǎng)絡(luò)中,他完成了對(duì)每一個(gè)素材的高清擴(kuò)圖、局部重繪、多角度反推和視頻生成。
整張畫(huà)布看起來(lái)像是一張精密的電路圖,這才是專(zhuān)業(yè)制片該有的顆粒度。
PART.02AI在LibTV:Agent制片廠
THUMBSTOPPING
如果LibTV僅僅停留在上述的畫(huà)布功能,它充其量只是一個(gè)更懂影視工業(yè)的AI創(chuàng)作軟件。
但它最令我感到震撼,甚至有些后怕的設(shè)計(jì),是它為軟件開(kāi)辟了真正的第二扇門(mén)。
過(guò)去二十年,所有軟件的迭代都在研究一件事:
如何讓人類(lèi)點(diǎn)擊鼠標(biāo)更加順暢。
但LibTV從產(chǎn)品構(gòu)架的第一天起,就為互聯(lián)網(wǎng)上游蕩企且數(shù)量指數(shù)級(jí)增加的Agent保留了平等的訪問(wèn)權(quán)限。
就在昨天,微信官方開(kāi)啟了微信ClawBot插件的灰度測(cè)試,允許用戶(hù)直接在微信里接入個(gè)人的OpenClaw(小龍蝦)。
借著這個(gè)契機(jī),我完成了一次極具賽博朋克感的創(chuàng)作體驗(yàn):
在微信的聊天框里,指揮一座制片廠。
推開(kāi)這扇門(mén)的鑰匙獲取異常簡(jiǎn)單。
![]()
在LibTV的網(wǎng)頁(yè)端設(shè)置中,我生成了一串專(zhuān)屬的 Access key。
完成授權(quán)后,我打開(kāi)了微信里與 ClawBot 的對(duì)話框,像給現(xiàn)實(shí)中的助理派活一樣,扔進(jìn)去了三張我自己隨手拍的充電寶照片。
并附帶了一句極其口語(yǔ)化、甚至有些抽象的要求:
幫我用這三張圖里的充電寶做一個(gè) Apple 風(fēng)格的宣傳片,要 30 秒哦。
![]()
隨后發(fā)生的運(yùn)轉(zhuǎn)過(guò)程,徹底打破了我對(duì)使用軟件的固有認(rèn)知。
我沒(méi)有打開(kāi)LibTV的網(wǎng)頁(yè),沒(méi)有建立任何節(jié)點(diǎn),更沒(méi)有去糾結(jié)什么是Apple 風(fēng)格的參數(shù)。
跑在背后的小龍蝦,通過(guò)安裝好的 libtv-skills,不僅一口氣吃下了這三張圖,還極其專(zhuān)業(yè)地將我這句外行的話,拆解成了工業(yè)級(jí)的執(zhí)行指令。
它在微信里冷靜地回復(fù)我,它已經(jīng)明確了重點(diǎn):
白/淺灰純凈背景、產(chǎn)品懸浮感、緩慢推進(jìn)與環(huán)繞運(yùn)鏡、避免廉價(jià)電商風(fēng)……
它甚至從我那幾張隨手拍的照片里,精準(zhǔn)提取出了黑色面板、金屬邊框、折疊結(jié)構(gòu)、20W標(biāo)識(shí)、背部磁吸圈等所有物理細(xì)節(jié)。
隨后,它自己分配了生圖和視頻模型,開(kāi)始了漫長(zhǎng)的生成排隊(duì)。
它甚至像一個(gè)成熟的制片助理一樣貼心地囑咐我:你過(guò)幾分鐘再問(wèn)我一句‘現(xiàn)在怎么樣了’,我繼續(xù)幫你盯進(jìn)度。
在當(dāng)前的算力下,一條高質(zhì)量的AI視頻往往需要十幾二十分鐘的等待。
但在這個(gè)過(guò)程中,你不再需要像過(guò)去那樣死盯著屏幕上焦慮的渲染進(jìn)度條。
當(dāng)一杯咖啡喝完,微信叮地響了一聲,成片出爐了。
但這并不是終點(diǎn),而是人機(jī)協(xié)作真正精妙的開(kāi)始。
在微信對(duì)話框里,Agent不僅返還了一個(gè)可以直接播放的視頻鏈接,還會(huì)附帶一個(gè)極其重要的東西:
LibTV Project 鏈接。
![]()
這是一個(gè)極其關(guān)鍵的產(chǎn)品哲學(xué)。
如果你發(fā)現(xiàn)視頻的某個(gè)畫(huà)面不符合預(yù)期,或者發(fā)現(xiàn) Agent 偷懶只給了成片卻沒(méi)有保留過(guò)程。
你不需要去修改代碼,你只需在微信里用自然語(yǔ)言訓(xùn)斥它一句:你的節(jié)點(diǎn)是空的,重新創(chuàng)建工作流,要把結(jié)果也都放到節(jié)點(diǎn)里。
或者直接命令:重試創(chuàng)建整個(gè)工作流放在畫(huà)布上。
Agent 會(huì)立刻乖乖地將后臺(tái)的隱形邏輯具象化。
當(dāng)你點(diǎn)擊微信里的那個(gè) Project 鏈接,跳轉(zhuǎn)回 LibTV 的無(wú)限畫(huà)布時(shí),你會(huì)看到令人頭皮發(fā)麻的一幕:
剛剛 Agent 在后臺(tái)思考的全部痕跡。
它是怎么寫(xiě)分鏡的,數(shù)百根邏輯線是怎么排布咬合的,那個(gè)20W標(biāo)識(shí)的特寫(xiě)參數(shù)是如何設(shè)置的,全都?xì)v歷在目。
這正是未來(lái)人機(jī)協(xié)作的默認(rèn)形態(tài):
Agent 負(fù)責(zé)在后臺(tái)干所有的臟活累活,承擔(dān)節(jié)點(diǎn)連線、模型調(diào)度與指令拆解,跑出一個(gè) 70 分的初稿;
而人類(lèi),則端坐在監(jiān)視器(畫(huà)布)前,接手剩下 30 分的精修。
機(jī)器負(fù)責(zé)苦力與規(guī)則,人類(lèi)負(fù)責(zé)審美與微調(diào)。
在這個(gè)極其日常的微信對(duì)話場(chǎng)景里,你甚至?xí)a(chǎn)生一種錯(cuò)覺(jué):
你不再是一個(gè)軟件的用戶(hù),而是一個(gè)只需發(fā)號(hào)施令、便擁有著不知疲倦的制片團(tuán)隊(duì)的賽博導(dǎo)演。
PART.03給予創(chuàng)作試錯(cuò)權(quán)
THUMBSTOPPING
我們常常說(shuō),AI時(shí)代的創(chuàng)作終局是審美。
但審美的殘酷之處在于:
審美,是建立在有得選的基礎(chǔ)之上的。
如果你只能拍一條素材,那叫記錄;
如果你能在一百條不同的素材里,挑出光影最對(duì)、情緒最飽滿的那一幀,那才叫導(dǎo)演的審美。
每一個(gè)AI視頻從業(yè)者都心知肚明,當(dāng)下的生成技術(shù)本質(zhì)上依然是一個(gè)對(duì)抗概率的游戲。
即使參數(shù)調(diào)得再精準(zhǔn),模型依然可能生成出物理規(guī)律崩塌的廢片。
一部真正的好作品,往往是由幾十上百個(gè)被廢棄的鏡頭喂出來(lái)的。
但在算力極其昂貴的今天,每一次生成都是真金白銀的消耗。
很多時(shí)候,創(chuàng)作者并不是缺乏好品味,而是高昂的容錯(cuò)成本逼迫他們只能妥協(xié)。
當(dāng)預(yù)算只夠生成5次時(shí),你只能在5個(gè)平庸的鏡頭里,挑一個(gè)相對(duì)不那么糟糕的。
高昂的算力成本,正在悄無(wú)聲息地鎖死人類(lèi)的創(chuàng)作上限。
LibTV 顯然看透了這個(gè)死結(jié)。
在它的無(wú)限畫(huà)布背后,其實(shí)隱藏著一個(gè)龐大且極其暴力的模型 Hub:
可靈3.0/O3、Wan 2.6、Lib Nano Pro,以及官方承諾即將獨(dú)家接入的頂級(jí)模型 Seedance 2.0,全都匯聚于此。
![]()
但它真正反常的地方,是對(duì)待算力定價(jià)的克制。
根據(jù)官方公布的數(shù)據(jù),在疊加權(quán)益后,LibTV 的綜合算力成本幾乎被強(qiáng)行壓到了市面同類(lèi)產(chǎn)品的兩到三成;
其模型積分的定價(jià),甚至比某些競(jìng)品低了九成。
![]()
針對(duì)訂閱用戶(hù),平臺(tái)直接白送了包含 150 條可靈 O3 和 150 條可靈 3.0 在內(nèi)的 300 條最高等級(jí)視頻額度。
在一篇討論產(chǎn)品邏輯的文章里,去羅列這些折扣數(shù)據(jù)似乎有些俗氣。
但對(duì)于真正的創(chuàng)作者而言,低廉的算力成本,本身就是現(xiàn)階段最核心的功能。
同樣的預(yù)算,過(guò)去你只能試錯(cuò) 10 次,現(xiàn)在你可以試錯(cuò) 80 次。
這多出來(lái)的 70 次機(jī)會(huì),就是人類(lèi)探索視覺(jué)邊界、捕捉偶然靈感、最終將極致審美落地的容錯(cuò)空間。
LibTV 實(shí)質(zhì)上是在用近乎底價(jià)的算力補(bǔ)貼,替創(chuàng)作者墊付了那張前往未知領(lǐng)域的門(mén)票。
當(dāng)試錯(cuò)不再讓人肉疼,絕不湊合的創(chuàng)作才有了發(fā)生的可能。
PART.04審美是不是最后一個(gè)壁壘?
THUMBSTOPPING
在長(zhǎng)達(dá)幾周的內(nèi)測(cè)體驗(yàn)中,我時(shí)常會(huì)思考一個(gè)問(wèn)題:
當(dāng)一個(gè)工具將繁瑣的執(zhí)行門(mén)檻降到如此之低,當(dāng)Agent可以代勞大部分的流水線工作,人類(lèi)創(chuàng)作者的核心壁壘究竟還剩下什么?
LibTV的出現(xiàn),其實(shí)是在剝離附加在視頻創(chuàng)作上的技術(shù)壁壘。
它明確地告訴我們,未來(lái)不再有人會(huì)因?yàn)槭炀氄莆漳晨钴浖目旖萱I或是精通某種模型的參數(shù)調(diào)度而成為大師。
技術(shù)的平權(quán)正在以前所未有的速度發(fā)生。
但這并不意味著創(chuàng)作者的貶值。
相反,當(dāng)工具足夠強(qiáng)大,當(dāng)Agent學(xué)會(huì)了聽(tīng)從差遣,決定一部作品高度的,將純粹回歸到人類(lèi)的判斷與審美。
畫(huà)面應(yīng)該傳遞怎樣的情緒?
劇情應(yīng)該在哪個(gè)節(jié)點(diǎn)反轉(zhuǎn)?
那一束光打在角色臉上的角度,究竟是為了映照內(nèi)心的掙扎,還是為了暗示命運(yùn)的走向?
機(jī)器或許能算出最符合物理規(guī)律的光影,但只有人類(lèi),才能決定哪一種光影能觸動(dòng)人心。
LibTV不是一個(gè)教你如何審美的系統(tǒng),它是一個(gè)讓你的審美可以被無(wú)損放大、高效執(zhí)行的基礎(chǔ)設(shè)施。
第一扇門(mén),它用無(wú)限畫(huà)布接納了人類(lèi)的細(xì)膩與控制欲;
第二扇門(mén),它用API接納了Agent的效率與執(zhí)行力。
現(xiàn)在,這座賽博時(shí)代的專(zhuān)業(yè)制片廠已經(jīng)正式開(kāi)門(mén)。
無(wú)論是親自下場(chǎng)連線,還是喚醒你的個(gè)人Agent發(fā)號(hào)施令,工具已經(jīng)準(zhǔn)備就緒。
只是這一次,考驗(yàn)?zāi)愕牟辉偈羌夹g(shù),而是你究竟能講出一個(gè)多好的故事。
PS:
如果你準(zhǔn)備好驗(yàn)證自己的審美與創(chuàng)意,歡迎探索下一代視頻創(chuàng)作系統(tǒng)。
Agent Skill接入請(qǐng)?jiān)L問(wèn) Github頁(yè)面:https://github.com/libtv-labs/libtv-skills )
![]()
感謝您的觀看我是Max,一個(gè)在AI方向持續(xù)探索的小學(xué)生。
我會(huì)持續(xù)更新一些AI方向最新最快的產(chǎn)品,技術(shù),思考求各位看官點(diǎn)贊,關(guān)注,再看三連
PS:歡迎加我的微信與我交流
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.