前幾天做了一個用 Nano Banana Pro 生成 PPT 的 Claude Code Skills。
但其實我一直想做的是實現一個現在都沒有 Agent 產品實現的能力。
為生成的 PPT 加上演示動畫,畢竟一個炫酷的 PPT 怎么能沒有演示動畫呢。
經過一天吭哧癟肚跟 Claude Code 的激烈討論,我終于搞定了,先看演示:
增加了動效之后的 PPT 看起來直接提升了一個檔次,想象一下你在給甲方講內容或者是一些公開的分享上掏出這么一手,然后說這都是 AI 做的,誰還能不相信你是 AI 專家。
介紹一下更新后的 PPT 生成 Skills 能力:
現在生成 PPT 的時候會詢問你是否要生成視頻轉場,如果你選擇生成的話他就會幫你導出一份圖片的演示和視頻演示。
其中視頻演示包含兩個部分,首先是一個寫好的網頁,方便你直接播放和演示,這里我還做了設計。
- 1.他只有在切換頁面的時候才會播放轉場視頻,然后就會替換為靜態圖片,方便你講解。
- 2.在首頁我專門做了無限循環的視頻設計,我們在一些公開場合演講經常要等人或者提前準備,這個時候 PPT 封面會一直是動態的,吸引大家的目光。
![]()
在這個演示頁面,你點擊空格就會開始播放演示視頻,鍵盤的左右鍵可以切換上一頁和下一頁。
另外的話這個 Skills 也會幫你導出一個完整的演示視頻,方便裝逼,你分享的時候可以直接發視頻。
![]()
這玩意怎么用
這是一個用在 Claude Code 或者 OpenCode 這類 CLI 工具的 Skills,所以我們首先需要安裝。
我已經把項目開源了,里面有 Claude Code 幫我寫的非常詳細的安裝指南。
順便夸一下 Claude Code 寫的這個 Readme 清晰而且詳細,我自己寫不知道得寫到啥時候。
項目地址:https://github.com/op7418/NanoBanana-PPT-Skills
![]()
這里我們只講怎么安裝為 Skills ,其他的安裝方式可以去上面項目內容中查看。
在安裝前我們需要簡單做一些準備,準備一可靈和谷歌的 API。
首先就是谷歌的 API,主要用于使用 NanoBanana Pro 模型生成圖片。
可以去 AI Studio 獲取(https://aistudio.google.com/api-keys),這里你的 API 需要開啟付費,免費的無法調用 Nano Banana Pro 模型。
![]()
然后是可靈的 API 這里主要用于給 PPT 生成轉場動畫視頻,我用的國內的版本。
你可以在這里充值(https://klingai.com/cn/dev/pricing?scrollTo=video),建議先用那個 69 塊錢的體驗包,這個并發只有 3 我已經在代碼里面做了處理。
![]()
然后我們就可以在這里獲取到需要的可靈 API 了(https://app.klingai.com/cn/dev/api-key)。
這里創建的時候會產生兩個 Key 我們都需要。
![]()
安裝方式也很簡單,如果你已經裝了 ClaudeCode 或者 OpenCode 這類支持 Skills 的 CLI 的話,直接把下面提示詞發給他們就行。
這里需要注意的是你需要將提示詞中的三個 API Key 改為你自己的,剛才我們都已經獲取到了。
請幫我將 NanoBanana PPT Skills 安裝為 Claude Code Skill:
1. 創建 Skill 目錄:
mkdir -p ~/.claude/skills/ppt-generator
2. 克隆項目到 Skill 目錄:
git clone https://github.com/op7418/NanoBanana-PPT-Skills.git ~/.claude/skills/ppt-generator
3. 進入目錄并安裝依賴:
cd ~/.claude/skills/ppt-generator
python3 -m venv venv
source venv/bin/activate
pip install google-genai pillow python-dotenv
4. 配置 API 密鑰:
cp .env.example .env
然后編輯 .env 文件,填入我的 API 密鑰:
GEMINI_API_KEY=YOUR_GEMINI_API_KEY
KLING_ACCESS_KEY=YOUR_KLING_ACCESS_KEY
KLING_SECRET_KEY=YOUR_KLING_SECRET_KEY
5. 驗證安裝:
python3 generate_ppt.py --help
完成后,告訴我如何在 Claude Code 中使用這個 Skill。我的 API 密鑰:
- GEMINI_API_KEY: YOUR_GEMINI_API_KEY_HERE
- KLING_ACCESS_KEY: YOUR_KLING_ACCESS_KEY_HERE (可選)
- KLING_SECRET_KEY: YOUR_KLING_SECRET_KEY_HERE (可選)
安裝的時候建議開啟 Plan 模式,這樣出問題的幾率會小點,同時如果安裝過程中,出問題就讓他自己修復就好。
Plan 的開啟方式是按兩次 Shift+ Tab 鍵。
![]()
安裝完成之后我們就可以使用了,首先需要將你想要生成 PPT 的文檔放到一個文件夾里面去,當然你也可以沒有文檔先讓他調用搜索工具幫你寫一個。
然后在這個文件夾里面啟動 Claude Code 。
這里順便推薦我的另一個開源項目 Claude-Start(https://github.com/op7418/ai-claude-start),可以快速切換 Claude Code 的模型提供商,方便你快速更換模型,實現多個 Claude Code 窗口用不同的模型啟動。
![]()
啟動了 Claude Code 之后我們就可以直接跟他說了,簡單來說就是“調用 Skills 將當前文件夾下的 XXX 文檔生成 PPT”。
Skills 啟動之后就會有一系列的選項讓你選擇,比如你要生成幾頁的 PPT、只生成圖片還是要帶動效視頻、圖片分辨率是多少,通過鍵盤的方向鍵正常選擇就可以,之后就是一路回車等待就可以了,全程不需要交互。
![]()
生成之后他會自動保存所有的 PPT 圖片并且給你一個用來演示 PPT 的網頁,你可以通過鍵盤在瀏覽器控制 PPT 的播放。
![]()
我的創作思路
剛開始的 Skills 創建方法在上篇內容基本上已經說過了,那部分直到生成圖片的部分還不是很復雜。
簡單來說就是準備好所有的上下文文件,比如圖片生成的提示詞、Nano Banana Pro 的 API 文檔以及你的 API Key 然后在那個文件夾打開跟 Claude Code 說你想要根據這些內容創建一個 Skills ,讓他創建計劃然后你審批繼續就行。
詳細的可以看我上一篇內容:
![]()
當時整個架構還是比較簡單的,加上視頻生成之后我們需要將圖片和視頻一起在網頁上演示,同時還需要輸出一個完整的視頻,這時候整個架構就比較復雜了。
我直接讓 Claude Code 幫我畫了個架構圖,我們可以看一下。
![]()
整個流程主要的步驟大概是這樣的:
- 先查找到用戶輸入的文檔和內容對文檔進行分析和內規劃。
- 然后調用 PPT 生成模塊和風格加載器
- 基于風格加載器和圖片生成模塊指導生成圖片生成需要的提示詞。
- 調用 Nano Banana Pro 的 API 生成圖片,同時監控生成過程
- 圖片生成完成后調用首尾幀提示詞和生成圖片為每個轉場生成首尾幀提示詞。
- 然后調用可靈 API ,用 Kling-2.6 視頻模型的 Pro 模式生成轉場視頻
- 將生成的視頻和圖片路徑放到演示網頁的代碼中生成一個演示網頁
- 同時調用本的 ffmpeg 將圖片和視頻剪輯成為一個完整的演示視頻
- 最后輸出完整視頻和打開最后的演示網頁。
這里比較重要的是在首尾幀提示詞生成的時候,我設計了一個元提示詞,Claude Code 會根據這個提示詞和生成的圖片來生成具體的提示詞,這種元提示詞后面會很有價值。
![]()
其中相對復雜的 FFmpeg 視頻合成流程和播放器系統的流程是這樣的。
雖然 FFmpeg 這里只是將圖片和視頻處理成一整個視頻,但是涉及到的內容也很多,比如圖片的時間控制,圖片和視頻分辨率的對齊最后的拼接和壓縮。
好了今天內容就是這樣了,這次這個復雜的 Skills 構建我自己也學到了非常多內容,建議大家都試試構建一個自己的 Agent,你就能理解 Agent 構建的難點和邏輯到底是什么樣了,也能對市面上的同類產品有一個大致的判斷。
我跟 Claude Code 老師也學到了很多的東西,比如讓他幫我畫流程圖來解釋整個 Agent 邏輯、API Key 應該怎么儲存、讓他幫我生成一個漂亮的 Readme 頁面降低入門門檻,甚至學會了如何在 GitHub 增加演示視頻。
而且我這個 Skills 基本全是用 Sonnet 4.5 模型生成的基本沒有調用 Opus 模型,大概花了 20 美元的 API 費用,我覺得已經很強了,畢竟 20 美元你得到了一個通用的 PPT 生成 Agent。
結合今天早上 Anthropic 的人說他們的 Cowork 這個功能和現在的 ClaudeCode 基本都是 Claude Code 自己寫的,我感覺 AI Coding 在最近已經到了一個臨界點,他們已經開始自己指揮自己和自我復制了。
可能再過一年,我們回想現在這個節點,會發現它是一個非常重要的事件。
感謝各位的閱讀,如果覺得對你有幫助的話,可以幫我點個贊或者喜歡,也可以推薦給你需要的朋友們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.