我最擔心的事情還是發(fā)生了。
試玩AI已經(jīng)跟不上開發(fā)AI的速度了,最近一個月我是Claude Code Skills,Claude Cowork,Clawdbot還沒玩夠又到下一個,我剛熟悉用Skills把文章發(fā)到X上,下周clawdbot就把這事包了。
為了省token,我的主力還是Claude code和Cowork,Cowork拿來處理本地文件就是無敵的,這兩天我拿到了天工Skywork桌面版的內(nèi)測,它在Cowork的基礎(chǔ)上做出了點不一樣。
![]()
skywork.ai/desktop 上線就全量
首先它原生支持Wins,因為我用Mac當主力機已經(jīng)有五六年了,Wins的快捷鍵早就忘了,所以它天然就可以幫我完成文件整理的工作,比方說我直接告訴它,
這是一個包含許多來自不同地方的旅游景點圖片的文件夾。將它們整理到不同類型的子文件夾中,每個文件夾的名稱代表圖片所在國家或地區(qū)。如果圖片無法分類,請將它們放入名為“未分類”的文件夾中。
這個任務的難度因為是相機拍的圖片,文件名一點用都沒有,需要模型理解每張圖片的內(nèi)容。
埃菲爾鐵塔,富士山,金字塔,它能通過圖像識別,準確判斷出這些照片的地理歸屬,然后自動執(zhí)行創(chuàng)建文件夾和移動文件的操作。我跳過了上傳下載新建文件夾,直接拿到的就是一個結(jié)構(gòu)清晰系統(tǒng)。
Skywork Cowork接入了多模態(tài)版本之子Gemini 3.0 Pro,我就用這個模型來把長視頻轉(zhuǎn)圖文筆記。而且Banana2也封裝成了Skills,整理文件夾里的零散筆記的時候順手就把信息圖做了,
![]()
我盤了一下,光是文檔處理就有pptx/docx/pdf/xlsx四件套,聯(lián)網(wǎng)搜索也帶上了Reddit/ArXiv(論文)/X/Youtube的,70個Skills相當夠用。許愿后續(xù)版本可以自己開發(fā)Skills或者錄入Github項目當Skills。
所以這一次,我跟我的肝一拍即可,決定用Skywork Cowork解決這兩周Claude Code Skills,Claude Cowork,Clawdbot的高光案例。
Here we go!
能自動整理文件還不是Cowork的極限,
我直接讓它二次利用整理好的圖片文件,
做一個PPT,這里每個子文件夾包含不同旅游景點的圖片。選擇所有景點并為每個景點創(chuàng)建一個單獨的幻燈片,介紹其名稱和基本信息。
然后它就kukuku開始干活了,
做成版PPT最耗時的部分,就是尋找素材,排版,填寫文字。有些素材我還不能用AI生成的。
所以這時候Cowork可以通過Skills自動調(diào)用PPT,批量插入圖片,通過圖片信息,聯(lián)網(wǎng)搜索相關(guān)的基礎(chǔ)介紹,自動填充到幻燈片里。
![]()
于是我設(shè)計了第三個,也是最復雜的一個案例,
視頻下載+視頻多模態(tài)分析+自動截圖+文檔生成
我自己看到都有點頭皮發(fā)麻,
【如何快速自學一個新領(lǐng)域?】(這里貼的是B站鏈接)用 Yt-Dlp Downloader 下載并整理 B站合集到本地指定文件夾,然后用Gemini 3.0 Pro對每個視頻逐段理解并和字幕逐行對齊,凡是字幕未覆蓋的關(guān)鍵信息就按時間戳截圖命名為 視頻名_時間戳_主題.png 并寫入要點說明,最后用 Summarize 產(chǎn)出 1頁總覽+章節(jié)目錄+每章知識卡片+截圖索引表,并用 docx 生成一份可直接分享的 Word 文檔保存
這個case我本來是拿來測上限,我真沒想到能給我做出來。這個場景的痛點,是因為我每天有看不完的文章,刷不完的視頻。
如何在一個全新的領(lǐng)域里快速入門?
比如我最近想了解某個知識,在B站上找到了一個非常好的系列視頻。傳統(tǒng)的方式是,打開視頻,準備好筆記本,一邊看一邊暫停,手動記錄要點。
一個小時的視頻,可能要花兩三個小時才能完成筆記。這個過程非常反人性,特別是那種對著黑板講的視頻,一個分神ppt就切走了,我就算用其他AI把字幕下載下來總結(jié),就會丟掉一部分ppt的信息。
![]()
Cowork把所有的臟活累活都干了,
我只需要去吸收最精華的知識本身,而且我是接受AI帶來的信息損耗的,因為仔細想想就是我去聽一張圖一張圖做筆記,偶爾也要翻看原視頻。
后面兩個case是上一次我測試Cowork的時候,發(fā)生評論區(qū)很多人提到的,
Excel類數(shù)據(jù)處理。幾百幾百條不夠挑戰(zhàn)性,我直接上一千,
用xlsx生成1000條模擬員工數(shù)據(jù)與工資明細并計算稅前稅后與匯總統(tǒng)計,再用Invoice Generator生成每人一頁工資條文件,隨后用Outlook按 [收件人郵箱清單Excel路徑] 批量發(fā)送并在郵件中寫入個性化字段與注意事項,最后輸出一份發(fā)送日志與統(tǒng)計報表到xlsx
這個流程極易出錯,要是放在公司里沒有系統(tǒng)輔助,我純?nèi)斯ひ惶熳?0條估計就要休息下班了。
但對于Cowork來說,這是一個純粹的邏輯執(zhí)行任務,中間的一些列還直接按工種的不同,生成不同的內(nèi)容。
![]()
昨天公眾號發(fā)了25年年度創(chuàng)作回顧,我一年活躍了364天,寫也寫了254篇內(nèi)容了,所以我就想把更詳細的數(shù)據(jù)導出來讓Cowrok分析一下,做個北極星指標出來。
用 xlsx 讀取 公眾號數(shù)據(jù)]并自動識別字段含義與口徑,按 天 周 月 生成核心漏斗與北極星指標表,輸出 包含指標定義 計算公式 異常值提示 結(jié)論建議 的分析報告到 docx,同時生成一份新 xlsx 含透視表與趨勢圖
PS,這里是模擬數(shù)據(jù)
用了一段時間后,這就成了很符合直覺的操作,我電腦還裝著ppt/word/excel這些軟件就是給AI用的,我不需要去記在哪里選中什么數(shù)據(jù)能做什么樣的折線圖。
要是Claude Code Skills,Claude Cowork,Clawdbot三個形態(tài)融合之后的Agent會什么樣呢?
我是希望就直接連主動提問都不需要了,
全天候錄屏?語音輸入,
把tokens價格打到地心,提示語也沒有復雜結(jié)構(gòu)了,純語音。Agent會成為我所看所想的延伸,
所以,我一直鼓勵身邊的所有人,
遇到問題,不管有多復雜,先試著用AI解決。
這樣你會發(fā)現(xiàn)很多意想不到的好用法,
比起去看十大用法和精選案例,。
自己去探索,碰壁,
反而能找到最適合你自己的工作心流。
不需要給AI設(shè)限,
也不用怕它運行失敗,
對于一個可以無限次執(zhí)行的Agent來說,
重復就是我們最大的底氣。
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉(zhuǎn)發(fā)|評論
如果想要第一時間收到推送,不妨給我個星標
如果你有更有趣的玩法,歡迎在評論區(qū)和我聊聊
更多的內(nèi)容正在不斷填坑中……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.