網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

全球首款龍蝦模型上線！Agent這波直接起飛了～（夾帶干貨）

2026-03-16 10:43:59　來源: 袋鼠帝

云南舉報

分享至

先看看用GLM-5-Turbo開發(fā)的：一人公司-龍蝦團隊管理系統(tǒng)

可以跟你的龍蝦配對，一鍵把龍蝦中的所有Agent納入系統(tǒng)進行可視化管理，非常直觀，他們甚至還能去喝水，換工位，哈哈就像一個辦公室一樣。

另外，我還找到了讓龍蝦幫我全自動操縱claude code完成長任務(wù)（一整晚那種）的終極方案，再也不用守著電腦當(dāng)claude code的監(jiān)工了！

大家好，我是袋鼠帝。

我最近每天都會盯一眼 OpenClaw 的微信指數(shù)。

然而這兩天我發(fā)現(xiàn)openclaw（龍蝦）的熱度開始斷崖式下降了。

這是為什么呢？

我跟幾位圈內(nèi)大佬交流了一下，大家的看法出奇的一致：狂歡過后，是一地雞毛。。

很多人一開始都是看熱鬧，各路媒體鋪天蓋地地報道，大家聽說出了個能代替人干活的賽博員工，還能裝進手機里，覺得非常NB，然后紛紛產(chǎn)生了羊群效應(yīng)，跟風(fēng)去部署或者買現(xiàn)成的龍蝦。

但是，隨著新鮮感褪去，大家開始發(fā)現(xiàn)不對勁了：

臥槽，我花了大價錢、費了老勁搞的這個龍蝦，怎么用起來感覺也就是個普通的聊天AI？在某些日常對話上，甚至還沒免費的豆包好用！

有些執(zhí)行力更強的朋友，給龍蝦裝了各種各樣的 Skills（技能插件），試圖讓它去執(zhí)行一些自動化任務(wù)。

結(jié)果發(fā)現(xiàn)，龍蝦干活慢吞吞的，而且有時候干到一半就莫名其妙的罷工或者報錯，讓人血壓飆升。

真相是：跟 AI 聊天和讓 AI 干活，完全是兩碼事。

你讓通用大模型跟你嘮嗑、寫寫文章，它非常擅長。但是，你讓它去執(zhí)行一個長鏈條的復(fù)雜任務(wù)，中間只要涉及多次工具調(diào)用、跨應(yīng)用協(xié)同，很多模型不穩(wěn)定，腦子容易亂。

問題出在哪？在于很多大模型并沒有專門針對龍蝦任務(wù)進行過訓(xùn)練。

以及你的使用方式可能沒用對，好的工程化+強大的模型=好用的Agent，龍蝦也不例外。

就在今天，智譜扔出了一顆重磅炸彈：正式發(fā)布了全球首個專門為龍蝦優(yōu)化的模型--GLM-5-Turbo。

這款模型是在他們原本就已經(jīng)很能打的旗艦級代碼模型 GLM-5 的基礎(chǔ)上，再次回爐，專門針對龍蝦流進行了深度訓(xùn)練，非常適合作為Agent的基座模型。

先給大家劃一下重點（省流版）：

工具調(diào)用極穩(wěn)：不再出現(xiàn)調(diào)錯接口、傳錯參數(shù)的低級失誤。

復(fù)雜任務(wù)規(guī)劃、拆解：你給它一個宏大的目標(biāo)，它能像個項目經(jīng)理、架構(gòu)師一樣，有條不紊的拆解需求，設(shè)計架構(gòu)，最終完成目標(biāo)。甚至還能輕易開啟多Agent去并行執(zhí)行。

長任務(wù)不中斷：它能處理那些需要掛機跑幾個小時的長線任務(wù)，中途不掉線、不失憶。

速度大幅提升：在處理邏輯鏈條長、吞吐量大的任務(wù)時，響應(yīng)速度也肉眼可見的變快了。

而且在正式發(fā)布之前，它是以 Pony-Alpha-2 的匿名代號在智譜的 AutoClaw（澳龍）上進行了內(nèi)測。

說實話，我原本是不太敢在自己這臺存了很多重要資料的主力辦公電腦上安裝開源的 OpenClaw 的，怕它權(quán)限太大亂動?xùn)|西。

但智譜官方出的這個 AutoClaw 在安全合規(guī)上讓人更放心，我就直接裝了。

https://autoglm.zhipuai.cn/autoclaw/

裝完之后，它有一個一鍵接入飛書的操作，直接給我看呆了。

我只點了一下授權(quán)登錄飛書，剩下的創(chuàng)建機器人、配置權(quán)限、配置長連接、發(fā)布版本那些繁瑣的步驟，在我面前全自動幫我做了。

開箱即用，這個體驗，真的有點爽。

由于我是coding plan的Max會員，又是博主，所以我提前拿到了這個 Pony-Alpha-2（也就是現(xiàn)在的 GLM-5-Turbo）的內(nèi)測資格，這幾天深度體驗下來，感覺非常驚艷！它確實對得起龍蝦專用模型這個稱號。

一、耗時兩天，打造了OpenClaw可視化管理系統(tǒng)

用過原生 OpenClaw 的朋友都知道，它的web界面比較簡陋，如果有多個Agent在后臺干活，根本不直觀。

所以我決定直接用OpenClaw結(jié)合GLM-5-Turbo，擼一套 OpenClaw 多 Agent 可視化管理系統(tǒng)。

把它當(dāng)做我一人公司的賽博辦公室，每個Agent都是我的員工，有自己的工位。

大致功能如下：

新增員工，可以看到它是從大門進來找工位工作的，他們還會時不時的去喝水

這套系統(tǒng)就是靠龍蝦 + GLM-5-Turbo 寫出來的。

花了兩天迭代，它幫我完成了包括 Vue 3 前端（帶有 Canvas 虛擬辦公室、深色 UI 和動畫系統(tǒng)）、Node.js 后端（包含 Express API 和 WebSocket 實時通信服務(wù)），還寫了一個準(zhǔn)備發(fā)布的 npm 包。

生成了幾十個文件，幾千行代碼，代碼質(zhì)量也非常穩(wěn)定。

中間遇到跑不起來的情況，基本都是我本地的 Node 環(huán)境或者端口沖突問題，代碼本身的邏輯漏洞很少。

最讓我佩服的是它在長程對話中的上下文記憶能力。

在開發(fā)過程中，我遇到了一個頭疼的 Bug：我派發(fā)出去的子 Agent 執(zhí)行完任務(wù)后，返回的結(jié)果總是空的。

這個問題有點復(fù)雜，需要模型同時理解 OpenClaw 的網(wǎng)關(guān)認證機制、后端降級架構(gòu)，以及各種 Session Key 的讀取邏輯。

它沒有像無頭蒼蠅一樣瞎改，通過層層排查，最終精準(zhǔn)地找到了病根：

原來是我代碼里讀取 Session Key 的函數(shù)，優(yōu)先返回了子 Agent 的 Key，而不是主任務(wù)的 Key，導(dǎo)致權(quán)限不足被網(wǎng)關(guān)攔截了。

不過這個項目目前還有一些點小瑕疵，準(zhǔn)備近期完善之后開源出來～

感興趣的朋友可以多多三連

二、AI監(jiān)工：龍蝦全自動操縱Claude Code寫代碼

做過 AI coding 的朋友肯定都有過這樣的痛點：

你想讓 AI 幫你寫個復(fù)雜的項目，雖然它能寫，但你得時不時盯著它。

它可能會寫了一段就停下來了，你得讓它繼續(xù)；或者遇到報錯卡住了，你得趕緊幫它看看。

這就有點煩，自己成了一個寸步不離的監(jiān)工...

而且，跟 AI 聊久了，上下文窗口一旦爆滿，它就會開始胡言亂語，忘了前面寫過什么。

然后，我最近看了 Anthropic 官方發(fā)布的一篇關(guān)于解決長時 AI 任務(wù)的博客。

https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

核心思想是：建立一套標(biāo)準(zhǔn)的交接班機制。一個負責(zé)初始化的 Agent 把大任務(wù)拆成一個個小任務(wù)清單，然后負責(zé)寫代碼的 Agent 每次只領(lǐng)一個小任務(wù)去開發(fā)，寫完、測試通過、提交 Git，然后再領(lǐng)下一個。這樣每次的上下文都很干凈。

我把這套機制的規(guī)則發(fā)給了接入GLM-5-Turbo的Claude Code。

它理解得很好，并生成了一套規(guī)則文件，如下：

工作流程是這樣的（如圖）：

然后我跟claude code進行了多輪對話，把我要開發(fā)的一個 API 中轉(zhuǎn)站項目（基于new-api做二次開發(fā)）需求對齊了，然后讓它寫了詳細的需求文檔和開發(fā)計劃。

并根據(jù)上面的全自動規(guī)則文件，幫我把任務(wù)，拆解成了詳細的feature_list.json任務(wù)清單。

但是，問題又來了。每次執(zhí)行完一個小任務(wù)，還是得我手動去敲回車，讓它繼續(xù)去領(lǐng)下一個任務(wù)。

這不還是得當(dāng)監(jiān)工嗎？

這時候，龍蝦就派上用場了，讓龍蝦來當(dāng)這個監(jiān)工！去監(jiān)督 Claude Code 干活～

我先讓龍蝦去學(xué)習(xí)了那套全自動管理的規(guī)則

然后我給龍蝦里的 GLM-5-Turbo 下達了指令，設(shè)置了定時任務(wù)：

每隔 5 分鐘去檢查一下任務(wù)清單里的任務(wù)狀態(tài)，如果發(fā)現(xiàn)上一個任務(wù)完成了，就自動通過命令行去喚醒 Claude Code 執(zhí)行下一個任務(wù)。

確認計劃沒問題之后，它就開始了。

這下，徹底解放雙手了～

第一次測試是在凌晨 1 點 55 分，我把這倆 AI 掛在Mac Mini上，自己睡覺去了。

第二天早上醒來一看日志，凌晨 3點5分的時候，第一版的 API中轉(zhuǎn)站二開任務(wù)已經(jīng)全部執(zhí)行完畢，并且測試通過。

后來，我又用同樣的方法，如法炮制，全自動重構(gòu)了第二版

這個方案是每開發(fā)、驗證完一個小任務(wù)，就會提交一次commit到Github，所以有完整的git記錄，整個過程的完成情況都可追溯，有跡可循。

由于new-api已經(jīng)是一個成熟的開源項目了，所以我對它的都是一些細小的改動，但即便經(jīng)過這么多次的修改，功能也沒有任何影響，還是非常穩(wěn)的。

GLM-5-Turbo 操控著龍蝦，龍蝦監(jiān)督著接入GLM-5-Turbo的Claude Code。真就是左腳踩右腳，直接螺旋升天...

那種徹底把重復(fù)性勞動甩給AI的爽快感，無法用語言形容。

目前我已經(jīng)讓GLM-5-Turbo把這套全自動管理任務(wù)的方案開發(fā)成了Skills，叫task-harness

并讓它幫我上傳到了github、和clawhub，有需要的朋友可以自取。

如果覺得有幫助的話，記得點個星標(biāo)哦，非常感謝～

https://clawhub.ai/kangarooking/task-harness

https://github.com/kangarooking/kangarooking-skills

「最后」

體驗下來，智譜這次發(fā)布的 GLM-5-Turbo干活能力非常強，而且很穩(wěn)定，確實是專為龍蝦優(yōu)化的模型。

畢竟，我們養(yǎng)龍蝦就是為了讓它幫忙干活的。

另外，智譜還推出了基于GLM-5-Turbo的龍蝦Claw套餐，包含個人版和Team版。

面向嚴肅的企業(yè)和個人辦公場景，這個套餐有嚴格的數(shù)據(jù)保護機制，配合國內(nèi)合規(guī)環(huán)境和企業(yè)級API，敏感數(shù)據(jù)全程可控，適合企業(yè)內(nèi)部AI系統(tǒng)無縫接入使用。

我作為coding plan深度體驗者，我想說，Agent時代，還得是套餐劃算啊。

這是我最近一個月在智譜花費的token，是2.15億（而且并不是天天用）。

Max套餐是按次來的，我用了2個月，就只觸發(fā)過一次限制。我買的是一個季度，算下來一個月160左右。

如果按照API的正常價格來算，2億多的token，感覺得上千了。

在大模型剛剛興起的時候，大家都在打價格戰(zhàn)，那時候覺得幾塊錢/100萬token的價格，簡直就是白菜價。但那時候的模型是玩具，你用它寫寫詩、聊聊天，免費的也湊合。

現(xiàn)在我們進入了 Agent 時代，各家又開始卷模型套餐價格了，雖然還沒到白菜價，但也就是你平時出去吃一頓的價格。并且你買的不再是那些虛無縹緲的 Token 數(shù)量，你是在雇傭一個 24 小時不知疲倦、不鬧情緒、還能不斷自我學(xué)習(xí)、進化的數(shù)字員工。

一個能幫你通宵寫完一個商業(yè)級應(yīng)用，或者每天雷打不動幫你盯盤、做競品分析的員工，你愿意給他開多少工資？

我相信，在接下來的幾個月里，能用好龍蝦等Agent工具的人，將會和還在用手敲鍵盤的人，拉開難以逾越的效率鴻溝。

以及不管有沒有養(yǎng)上龍蝦，都可以去智譜領(lǐng)養(yǎng)一只澳龍體驗一下，一鍵安裝，開箱即用，而且非常強大。以下是來自朋友的肯定～

我是袋鼠帝，一個致力于幫你把AI變成生產(chǎn)力的博主。我們下期見～

能看到這里的都是鳳毛麟角的存在！

如果覺得不錯，隨手點個贊、在看、轉(zhuǎn)發(fā)三連吧~

如果想第一時間收到推送，也可以給我個星標(biāo)?

謝謝你耐心看完我的文章~

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.