![]()
最近一直在想一件事:
人跟人之間的信息傳遞,效率最高的方式是什么?
以前我覺得是語言,后來覺得是文字,再后來覺得是代碼或者AI。
但現在我越來越確定,是視頻。
為什么短視頻能統治世界?因為它最符合人類大腦的底層偏好,視覺信息處理就是我們的本能。
但從另一個角度來說,視頻也是門檻最高的表達方式。作為AI創作者,哪怕已經有20萬粉絲了,我的視頻表達依然存在障礙。
寫一段文字,打開備忘錄就能干。拍一條視頻,就需要腳本、分鏡、拍攝、剪輯、調色、配樂。
即使是用AI生成,也得在各個平臺之間來回切換,生圖用一個工具,生視頻用另一個工具,剪輯還得再開一個軟件。
流程碎得跟餃子餡似的,抽卡抽得跟賭徒似的,排隊排一夜前面還有幾百人……
![]()
是時候讓Agent表演真正的技術了。
是時候輪到Agentic Visual Studio登場了。
前幾天,我拿到了LibTV的內測資格,有點去年3月剛看到Manus的喜悅感,但LibTV完成度更高。
![]()
官網:https://www.liblib.tv/
我在想,不管是從token需求的角度、還是消費性的考量,視頻Agent理應比去年的文本Agent,有更大想象空間。
下面帶大家看看我的使用感受。
01LibTV:一塊畫布、一部電影
LibTV是LiblibAI他們家新推出的為專業創作者準備的 AI 視頻創作平臺。
好像不知不覺,Liblib系已經形成AI視覺家族了,很有種Agentic Visual Factory智能工廠的感覺。
這次LibTV有啥不一樣呢?它同時做了兩件事。
第一個,是給人類創作者準備了專業入口——一塊無限大的畫布。
![]()
可以在這塊畫布上,擺放劇本、分鏡、角色設定、視頻片段、配樂音效。
所有東西都在同一個空間里,抬眼就能看到整個項目的全貌。
![]()
跟著自帶的視頻指示,走一遍,就理解了,很容易上手。
9 / 25 宮格分鏡生成、一鍵生成完整故事板、劇情推演四宮格、快速測試不同劇情走向、多機位 9 宮格鏡頭設計、模擬真實影視機位調度;
還有角色三視圖生成、快速建立穩定角色設定、畫面時間推演:自動生成前 3 秒 / 后 5 秒畫面延展……
各種首創的功能和組合,都在畫布里,滿足專業視頻創作的復雜需求。
第二個,是給Agent準備了一個Skill入口。
那些正在快速進化的個人AI助手,比如小龍蝦,可以通過Skill接口直接調用LibTV的創作能力。用Agent的協同,完成從劇本到成片的全部工作。
![]()
都說26年的產品要Not for Human, for Agent,但LibTV說,我全都要。
這個設計思路很有意思。
過去二十年,軟件產品的成長路徑幾乎都是同一條:
先做一個好用的界面,把用戶圈進來,做到足夠大以后再開放API,讓開發者來做集成。GUI是正門,API是后門。
但Agent的出現打破了這個先后順序。
當軟件的調用者不再只是人類,而是同時包括成千上萬個Agent的時候,API不再是長大以后才需要考慮的事。
它從第一天起就和GUI同等重要。
LibTV,是視頻創作領域,第一個從Day1就把人和Agent當作兩個平等用戶來設計的產品。
豐富的功能,也讓創作者不再只是生成單個畫面,開始能真正組織一整套視頻創作流程、完成一支完整的視頻作品。
事情變得更有趣了。
02怎么玩:從無限畫布說起
打開LibTV,開始創作,首先看到的就是畫布,乍一看很簡潔。
但當開始在上面有點擊的動作,就會發現藏了很多后手。
無限畫布上,有4大功能模塊:
「項目菜單欄」「畫布左側欄」「個人中心」和「小地圖導航」。
![]()
在項目菜單欄里,一個無限畫布就是一個項目,點擊畫布左上角的 Logo 會彈出「項目菜單欄」可以對項目進行管理。
畫布左側欄,設有「添加」「工作流」「資產」「歷史記錄」「教程」5大功能。
畫布右上角,是用戶相關功能,包括「發布&分享」「通知」「會員中心」「積分消耗」「個人中心」。
左下角的小地圖導航,我尤其喜歡,跟打游戲看地圖一樣。
然后關鍵的來了,一個最核心的構成要素:節點。
畫布上,有五種基礎節點:文本節點、圖片節點、視頻節點、音頻節點、腳本節點。
![]()
先帶大家看看文本節點。
通過集成了多個語言模型的文本生成器,可以輸入自然語言需求或結構化提示詞,讓語言模型完成對應的文本生成任務。
生成的結果,會展示在「文本節點框」中。
相當于是說,5種不同模態的生成能力,在LibTV里可以自由控制,用節點進行連接和組合。
再也不用先產出文字腳本、再生圖、再配樂、然后圖生視頻等等,不用切換網頁、存來存去的,在一個畫布里,把完整視頻該有的步驟全搞定。
![]()
五種節點,讓我想起了曾經玩ComfyUI的日子,connecting the dots真的很有趣。
而現在的LibTV,就更容易上手、更好玩了,邏輯上似乎和從Stable Diffusion到Liblib的遷移如出一轍。
讓我覺得厲害的,還有工作流功能。
所有節點之間都可以連線,搭建出一條能反復跑的創作流水線。
比如我調出了一條比較順手的流程:參考生圖→圖轉視頻→高清增強。
我把這套流程存成了資產,以后做類似項目的時候,打開畫布、換一批輸入,就能復用整套流程,不用每次都從零開始。
下面就是一個簡單的「參考生圖→圖轉視頻」工作流,帶大家感受一下。
工作流創建好以后,就像這樣
![]()
LibTV還塞進去一堆很實用的預制功能。
多機位九宮格、劇情推演四宮格、25宮格連貫分鏡、角色三視圖、畫面推演前后幾秒……
這些都是輸入指令就能直接調用的魔法。
不用自己設計工作流,只要選中素材、觸發指令,它就幫你生成一整塊結構化內容。
![]()
03再說說Agent
前面的部分似乎還是workflow的范疇,屬于視頻流程的AI化改造。
但從Agent開始,事情又不一樣了。
這個部分更科幻。
我在龍蝦對話框里輸入了一句話:給我的耳機做一個宣傳片,風格參考這個視頻鏈接。
然后把一個參考視頻的URL扔了進去。
![]()
接下來發生的事情讓我有點恍惚。
我的Agent自己去LibTV調用了復刻TVC Skill,自動解析原片的鏡頭語言和風格,生成劇本,設計分鏡,調用模型生成視頻片段,最后剪輯成片。
整個過程我沒插手一下,它就給我交出了一條30秒的宣傳片。
![]()
錄屏里能看到,Agent在后臺自己搭建節點、連接工作流、調整參數,像一個看不見的實習生在那兒埋頭干活。
雖然生成的時間有點長,畢竟要跑好幾個模型,但最后出來的成片質量,說實話,比我手動做的第一條還要好。
我還試了另一個Skill:短漫劇生成。
輸入創意描述,Agent自動完成了劇本、角色設計、分鏡、視頻、音效、剪輯,給我交付了一部完整的2分鐘短劇。
主題是《墜入深海》,講了一個挺有意思的驚悚寓言。效果就不錯下面
![]()
這種感覺很奇妙。以前是我指揮工具,現在是我跟Agent協作。
我負責給方向和審美判斷,它負責執行和擴展。創作這件事,第一次有了交響的感覺。
04為什么我覺得LibTV不一樣
用下來,有幾個點讓我覺得這產品確實想清楚了。
第一,它真的懂創作者需要什么。
LibTV目前上線了20多個專業視頻創作功能,其中好幾項是行業首次推出。9/25宮格分鏡生成、一鍵生成完整故事板、劇情推演四宮格、多機位9宮格鏡頭設計、角色三視圖生成、畫面時間推演……
這些功能不是拍腦袋想出來的,一定是跟大量創作者聊過之后才知道他們真正缺什么。
我以前做分鏡,最煩的就是一張一張生圖然后手動拼板。
![]()
現在一鍵生成,省下的時間可以用來琢磨鏡頭語言本身。我以前調整角色設定,最煩的是換一個角度就得重新抽卡。現在角色三視圖生成,一張圖搞定正面側面背面,人物設定穩定多了。
這些細節說明產品經理是真下場做過活的。
第二,它在定價上狠起來連自己都砍。
之前抽卡,有的產品,抽一張兩塊,抽一百張兩百塊,做個幾分鐘的視頻下來,成本輕松破千。
LibTV的定價我看了一下數據:年卡最低39折,部分模型還有額外6折優惠,會員SKU價格比競品低76%,模型積分定價比競品低92%。換算下來,相當于你用兩折多的成本,就能跑出同樣的作品。
現在開會員,還會給訂閱用戶贈送最多150條可靈O3+150條可靈3.0,共300條免費最高等級的視頻,任意使用。
價格屠夫這個詞用在這里一點不夸張。
第三,它押注了一個正在發生的變化。
AI的能力正在經歷第三次躍遷。第一次是學會對話,第二次是學會調用工具,第三次是學會理解復雜任務、自主編排工作流、在項目級上下文中持續迭代。
正是這第三次躍遷,讓傳統的軟件產品必須做出改變。
Agent已經成熟到可以作為獨立的創作主體參與工作,它需要的不再是一個API,而是一個為它設計的、任務級的能力入口。
LibTV為Agent設計了Skill入口,讓Agent可以像人一樣理解任務、調用能力、完成創作。
隨著社區的豐富,你的Agent可以在LibTV上執行越來越復雜、越來越貼合你審美的創作任務。
![]()
這也是在為即將開啟的Agent to Agent時代做準備。
05關于Agent、命令行、審美
更深一層想,LibTV想做的其實不是工具,而是一種新的創作結構。
命令行也許更適合效率類的工具,但是文藝創作的價值,恰恰在于人本身的參與。
一部電影之所以好看,不是因為畫面技術上完美無缺,而是因為某個鏡頭里,有一個只有這個導演才會做出的選擇。
我始終相信一件事:真正決定作品高度的,永遠是人的判斷與審美。
AI可以幫你生成一萬個鏡頭,但只有你知道哪一個鏡頭是對的。Agent可以替你完成整個制作流程,但只有你知道這個故事想表達什么。
而LibTV的節點、工作流、Agentic Skills……讓審美變成了可執行、可流通、可積累的東西。
人在創作,Agent在學習,社區在流轉,工具在進化。四件事同時發生,沒有先后,沒有邊界。
到最后會發現,它成了一臺驅動審美的引擎——越來越高質量的作品,自然地從系統里長了出來。
![]()
LibTV讓我看到了一種可能性:當工具足夠強大,當Agent足夠聰明,創作者終于可以把精力從繁瑣的執行中解放出來,去思考那些真正重要的問題——
我想講一個什么故事?我想讓觀眾感受到什么?這個鏡頭為什么要這么拍?
這些問題,AI回答不了。但它們才是一切創作的原點。
![]()
從國內導演圈、制作圈到好萊塢,普遍有種對AI來臨的恐慌和焦慮。
但在我看來,像LibTV這樣的產品,已經事實上
不妨試一試:https://www.liblib.tv/
如果想研究一下背后的技術原理,GitHub在這里:https://github.com/libtv-labs/libtv-skills
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.