![]()
如果從技術(shù)演進(jìn)的角度復(fù)盤最近一年的 Agent 項(xiàng)目,一個(gè)越來越清晰的事實(shí)是:
問題正在從“模型夠不夠強(qiáng)”,轉(zhuǎn)向“系統(tǒng)如何承載判斷”。
Claude、GPT 這類模型在生成能力上已經(jīng)高度成熟,至少在大多數(shù)工程場(chǎng)景中,“能不能生成”早已不是主要限制。
真正開始拖慢系統(tǒng)演化速度的,是我們把大量本該被工程化、被結(jié)構(gòu)化的判斷,持續(xù)交給模型在運(yùn)行時(shí)即興完成。
這個(gè)問題在系統(tǒng)早期往往不明顯。Agent 的第一個(gè)原型通常表現(xiàn)良好,一個(gè) prompt,加上一點(diǎn)工具調(diào)用,就能跑通完整流程。
但隨著場(chǎng)景增多、上下文變復(fù)雜、需求開始疊加歷史約束,系統(tǒng)會(huì)逐漸進(jìn)入一種工程上非常危險(xiǎn)的狀態(tài):
行為開始變得不可預(yù)測(cè),但你卻很難準(zhǔn)確定位問題發(fā)生在哪一層。
![]()
模型參數(shù)沒有變,數(shù)據(jù)來源也沒有明顯變化,業(yè)務(wù)邏輯看起來仍然成立,但結(jié)果卻開始呈現(xiàn)出“有時(shí)對(duì),有時(shí)不對(duì)”的不穩(wěn)定特征。
關(guān)鍵并不在于模型是否足夠穩(wěn)定,而在于系統(tǒng)結(jié)構(gòu)是否在回避一個(gè)更基礎(chǔ)的問題:
哪些判斷應(yīng)該被固化為系統(tǒng)能力,哪些判斷才值得在每一次調(diào)用中重新推理。
當(dāng)所有判斷都被交給模型即時(shí)完成,系統(tǒng)規(guī)模越大,不確定性就會(huì)被放大得越快。
![]()
從這個(gè)角度再回頭看 Claude Skills,會(huì)發(fā)現(xiàn)它并沒有試圖解決“更強(qiáng)智能”的問題,而是在解決一個(gè)更底層、更工程化的難題:
如何把已經(jīng)被反復(fù)驗(yàn)證過的能力,從不透明的 prompt 行為中拆解出來,變成可管理、可復(fù)用、可回收的系統(tǒng)組件。
Skill 的價(jià)值,并不在于能力本身,而在于它讓經(jīng)驗(yàn)第一次具備了長(zhǎng)期資產(chǎn)的形態(tài)。
![]()
![]()
這也是為什么當(dāng)系統(tǒng)里的 Skills 從十幾個(gè)增長(zhǎng)到幾十個(gè)、上百個(gè)時(shí),能力管理本身會(huì)迅速成為瓶頸。
最近看到的特贊科技 atypica.AI 發(fā)了一個(gè)( http://skill0.io/),正是圍繞這一問題給出的一個(gè)具體實(shí)踐:
當(dāng)能力規(guī)模擴(kuò)大,如何讓不同團(tuán)隊(duì)知道哪些能力已經(jīng)被驗(yàn)證、哪些仍處在試驗(yàn)階段,以及如何避免在系統(tǒng)內(nèi)部反復(fù)造輪子。
如果缺少這樣一層能力承載機(jī)制,所謂的 Agent 架構(gòu),最終很容易退化回 prompt 的堆疊。
![]()
![]()
在這一過程中,Agent 的角色也在悄然發(fā)生變化。
與其讓 Agent 承擔(dān)越來越多“會(huì)做什么”的職責(zé),不如讓它回到一個(gè)更克制的位置:理解上下文、做路徑選擇、判斷是否調(diào)用某種能力。
執(zhí)行的確定性盡可能被 Skills 吸收,不確定性才留給推理層處理。到這個(gè)階段,系統(tǒng)關(guān)注的重點(diǎn)自然會(huì)從“輸出是否漂亮”,轉(zhuǎn)向“判斷是否正確”。
![]()
從行業(yè)整體來看,這并不是某一家團(tuán)隊(duì)的獨(dú)立選擇,而是一種越來越普遍的工程收斂方向。
當(dāng) Agent 真正進(jìn)入復(fù)雜系統(tǒng)、長(zhǎng)期運(yùn)行環(huán)境之后,判斷如何被工程化、被治理,正在取代模型能力本身,成為新的技術(shù)分水嶺。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.