我昨天發了一篇文章,中間有一個觀點。
就是AI時代,你的產品,可能得同時為了人類和Agent共同設計。
我前幾天出去給人分享的時候,在PPT上也寫過這個判斷。
![]()
未來的很多產品,可能都會是兩個入口并存。
一邊是為人類而設計的UI界面,一邊是純粹為了Agent而設計的Skills。
而昨晚,Liblib發了一個他們的AI視頻產品,我覺得非常有意思。
因為,他們的產品,應該是我第一個看到的。
為人和Agent共同而設計的AI視頻產品。
而且,用一種很優雅的姿態,解決了一個在交互設計領域一直以來都很絕望的問題,就是怎么同時兼顧專業用戶和普通用戶。
這個東西,名叫LibTV。
網址在此:https://www.liblib.tv/
![]()
這個產品,讓我一時間,不知道從哪下筆。
因為,這玩意真的就是面向人類和Agent雙向出擊。
給人類用的,就是極度全面、復雜、專業、需要連線和節點的無限畫布。
給Agent用的,就是一個使用起來極度簡單、無需理解、開箱即用的SKills。
先說這個給人類用的無限畫布。
先給大家看一個工作界面,這是一個大佬叫畢加索隆,在上面做的片子《索拉里斯之船》,我非常喜歡這個片子和他的藝術風格。
而這,這是他的畫布界面。
看的我腦殼疼。
![]()
就咋說呢...雖然節點式的畫布看著復雜,對普通用戶來說確實有點難上手。
但是我覺得只要是希望能創作最頂級AI短片AI廣告的那些專業創作者,我相信他們絕對會喜歡這個產品,因為,真的太頂了,你能想象到的一切功能,LibTV都給你做了上去。。。
支持劇本、圖片、視頻、音頻全鏈路。
![]()
你可以,一口氣,直接在這里面,完成所有素材的制作。
比如,生成圖片。
![]()
當然,你也可以自己傳一張圖片上去,進行處理。
而LibTV這個畫布,對圖片的處理,我感覺就是變態級的。
高清、擴圖、重繪、擦除、摳圖這些都正常做了,自不必說。
![]()
還有兩個他們雕花雕的很有趣的。
一個是多角度,直接就預設好了一堆的視角,你一張圖扔進去了,就非常非常便捷的,可以出任意視角的圖,而且穩定性極高,左邊的3D的預覽做的也非常有意思。
![]()
一個是燈光。
![]()
真的,一鍵改成各種角度的光,極其穩定,輪廓光也能生成。效果非常好,我就隨手改了一個右側50%亮度帶有輪廓光的打光,還有一個左側的75%亮度的效果。
而當你想繼續用這張圖生成后續的內容的時候。
你就可以引用這張圖,反推Prompt成文本,或者圖生圖,或者生視頻,等等等等。
![]()
比如我們選擇繼續生圖,你就能看到一個非常多功能的輸入框。
![]()
有預設風格,有尺寸,有比例,還能選模型。
![]()
然后還有個非常離譜,雕花雕的賊細的攝像機控制。
![]()
我第一次見到真的有UI,把相機的實物和鏡頭的實物,還有各種光圈和焦距全扔進來的。。。
這真的是,正兒八經的攝像機控制了。。。
而且,還有更多的功能和預設,被藏在了/的命令里,你敲一下就能看到了。
![]()
我們可以直接來生成個,劇情推演的四宮格,看看后面的動態演變幀。
沒一會,四宮格就生成好了。
![]()
然后,你還可以用工具欄的網格切分功能,把圖片提取出來。
![]()
比如我們是四宮格,就可以選中四宮格切分,再選中右上和左下。
![]()
然后,這兩張圖就被提取出來了。
![]()
他們真的,我覺得已經把基于工程能力上的雕花雕到極致了。
而所有的圖片的處理,其實最后,都是為了視頻服務的。
你可以給最終的圖片節點連線,調用現在幾乎所有的視頻模型來幫你生成。
![]()
為啥我說是幾乎所有呢。。。
因為缺了現在最大的那個爹,Seedance 2.0。
不過也能理解,Seedance 2.0現在幾乎沒有對外開放,自己內部排隊都排N個小時,就看Lib啥時候能鈔能力發作,把Seedance 2.0給拿下來了,我是真的很想在這種畫布上,來去創作視頻的,太順了。
生成完的視頻,你也可以繼續剪輯、超分,還有個有趣的東西,叫解析。
![]()
其實就是你可以對它,進行一個更細節的拉片。
![]()
而這個東西,也就是他們自己比較獨有的,腳本節點。
你可以給一段劇本,來幫你生成對應的分鏡腳本。
![]()
你也可以通過角色設定+一段話,來生成一段分鏡腳本。
![]()
當然,也都可以合并在一起。
這套流程,其實對做AI短劇或者AI漫劇,就非常的有用了。
還有音頻節點,音頻驅動數字人。
![]()
或者生成音樂等等。。。
功能太多了,我就不列完了,我覺得,你是個AI創作者,你就可以上去試試看,這是一個我現在應該見到的,非常非常完整的AI視頻創作工具。
并且,里面的積分和會員,是跟原來的liblib直接打通的,所以你原來的會員和積分,也可以沒有任何成本的遷移到LibTV上來用。
面向人類的部分說完了。
接下來,說一下面向Agent的部分。
我覺得LibTV這次做了一個很好的示范,不過可能也是第一次嘗試,所以在入口上,沒有那么的激進。
點開你的頭像,然后就能看到一個Access key的東西。
![]()
點它。
你就能看到一個彈窗了,這個彈窗里,有Skills的鏈接,還有你自己的key。
![]()
這個key的意思,就是你的Agent在用LibTV時候的一個憑證。
讓你的Agent,包括Claude Code、Codex、OpenClaw等等安裝這個LibTV skill也非常的簡單。
直接一句話:
幫我安裝https://github.com/libtv-labs/libtv-skills這個skill。
跑一會后,就OK了。
![]()
在彈出這么一段以后,因為里面沒有自帶的key,所以其實還用不了,就跟小龍蝦里面NanoBanana之類的Skills一樣,所以,記得把你的Key直接發給它。
然后就OK了。
因為LibTV自己能力的豐富性,所以,幾乎你能想象到的一切,無論是寫腳本、生圖、改圖、生視頻、編輯視頻、生成音樂等等。
你全都可以讓LibTV來干,甚至有了它之后,你幾乎就不需要那些各種各樣的生圖生視頻的Skills了。
就這一個Skills,全部搞定,我感覺這玩意已經可以進入到我的必裝Skills列表里面了。
而且我看了一下他們的Skills,其實用戶側暴露的東西還比較少,幾乎最重要的功能,就是觸發和通信。
![]()
所有的一些改分鏡、模型調用、做漫劇等等偏向知識型的能力,應該都是他們后端部分的Skills去處理了。
所以,大概的交互流程其實就是,用戶提出一個Prompt,比如說是要生圖生視頻或者改圖改視頻啥的,通過Skills的機制,觸發了LibTV,LibTV將用戶的內容原封不動的傳到了LibTV的后端Agent上,然后后端Agent根據自己的內部Skills開始調用模型進行創作,最后再通過通信,給用戶側進行返回。
![]()
這個做法,其實我是比較認同,因為現在的很多Skills,大半都是直接開源出來給大家的,然后里面的一些核心經驗和Know-how,其實都是裸奔的。
沒有壁壘,就沒有保護,沒有保護,就很難有商業化的空間,沒有商業化,那這個生態,就很難轉起來。
所以,用戶側的Skills只負責觸發和通信,真正的能力全部跑在他們自己的后端Agent上。
這也意味著,他們可以不斷迭代自己后端的Prompt、模型調用策略、分鏡生成邏輯,而這些東西,外面是看不到的。
這個思路我覺得對很多想做Skills的團隊都很有參考價值,你對外發布的,完全可以是接口,不是大腦。
Agent生態需要開放,但開放不等于把自己的核心競爭力全部掏出來送給別人。
用起來也很簡單,我用Claude Code舉個例子。
比如說,我們可以先生圖。
我把我想生的圖,直接扔給了Agent:
幫我生成一下圖片:黑白、模糊的歌劇芭蕾舞者,使用Canon K-35拍攝,風格為Jeanloup Sieff,16:9,2K,幫我生成4張。
![]()
這時候,就會自動調用LibTV的Skills,來觸發這個生圖任務。
LibTV把這個Promtp傳到了他們的后端Agent,然后自動開始跟后端進行輪詢。
![]()
大概幾十秒以后,圖片生成成功,我們拿到了生圖的結果鏈接,同時幫我們把這四張圖片,自動下載了本地,還會返回給你一個他們的畫布項目鏈接。
這個是我覺得非常屌的地方,可以直接跟畫布打通,你的每一個任務,就會自動以一個真實的項目放在你的畫布里,所有的節點也都是串好的。
所以你也可以,跟你真實項目聯動上,這個覺得非常的好。
![]()
生成出來的圖長這樣,我自動拼了一下。
![]()
效果還是相當不錯的,現在,我覺得第一張圖很不錯,我想讓他驅動成一個10s的視頻。
我就可以繼續直接說。
![]()
這時候,Skill就會自動把你這張圖,傳到后端,來去幫你生成視頻了。
大概自動輪詢兩分鐘以后,這個視頻就生成完了,自動放在了你的本地。
![]()
可以看看這個視頻。
這只是一個非常簡單的,沒有跟其他的Skills去搭配的生圖生視頻的玩法。
你也可以,一句話,來幫你復刻一個爆款視頻,然后生成一個TVC廣告。
或者,一句話,給一首歌,配上MV。
這個case我覺得挺有意思的,來自Fine大佬。
Prompt也究極簡單:根據坂本龍一《Rain》音樂,做一個MV視頻。
雖然我覺得還有很多優化的空間,但是畢竟我們從來不指望,Agent能一次性給我們一百分的東西,能給出70分的東西,我們再手動優化成100分的內容,這個我覺得就是未來創作的核心。
畢竟,還有那個,整個為人類設計的無限畫布嘛。
Agent出初稿,人類去無限畫布上優化,這個就是我覺得,可能未來最普遍的創作方式了。
同時為人類和Agent設計,完美解決了專業用戶和普通用戶的使用問題。
專業用戶,你就去用無限畫布。節點連線、參數調整、模型選擇、攝像機控制、光圈焦距等等等等,都是為了方便你最好的控制,你是專業創作者,那這些復雜度,就是你的武器。
而普通用戶,你都不需要打開這個畫布。你裝一個Skills,跟Agent說一句,Agent就會調用LibTV的Skills,后端Agent自己去處理分鏡、選模型、調參數、生成視頻,你什么都不用懂,但最后的結果,就全部會直接給你,你完全可以感受到,言出法隨的魅力。
同一個產品,同一套底層能力,但通過兩個完全不同的入口,分別服務了兩類完全不同的用戶。
這就是我昨天說的那個判斷的具體形態。
兩個入口背后,其實都是底層功能的原子化能力的重組。
這個形態,我覺得可能才是Agent時代產品設計的真正答案。
就目前來說,絕對不是非此即彼,也不是UI死了Skills活了。
是兩條路同時走,各自服務各自的用戶,最終匯入同一個能力內核。
從此。
人類與Agent共生。
天下大同。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克
>/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.