網易首頁 > 網易號 > 正文申請入駐

模型不再是關鍵？LangChain 創始人：真正決定Agent 上限的是運行框架

2026-03-13 13:02:48　來源: AI前線

北京舉報

分享至

作者 | 允毅

伴隨模型能力持續躍遷，簡單調用 LLM API、套一層提示詞就能做產品的時代，已經走到盡頭。

AI 應用正在從“單次生成”，邁向“持續執行”。下一代軟件系統，不再只是把大模型接進工作流，而是圍繞一層全新的 agent orchestration 架構展開：它負責讓智能體自主規劃、調用工具、編寫代碼、管理文件、壓縮上下文、調度子智能體，并在長時程任務中保持連貫行動。

這也意味著：簡單封裝 AI 的時代正式結束，整個軟件基礎設施層，正在被重新書寫。

剛剛完成 1.25 億美元新融資的 LangChain，正是這場浪潮的定義者之一。其創始人 Harrison Chase 在最新一期播客中圍繞 “到底是模型吞噬框架，還是框架吞噬模型” 的行業爭論，直接指出“框架才是未來，模型終將走向商品化”。

在這場對話里，他首次清晰定義出現代智能體的四大核心組件：系統提示詞、規劃工具、子智能體、文件系統，這是目前業界最統一的 “標準架構”。

面對未來趨勢是超強單智能體還是專業多智能體協作，他認為最有價值的永遠是指令和工具本身。

他自曝當初創建 LangChain，正是看準了 LLM 循環調用工具的巨大潛力。從早期開源框架，到 LangGraph、Deep Agents、LangSmith 再到 Agent Builder，LangChain 自身也完成了從 “實驗玩具” 到 “生產級智能體運行時” 的蛻變。

Harrison Chase 透露，LangChain 接下來的核心方向很明確：一邊押注商業化表現最強的可觀測性，一邊補齊部署與無代碼能力，朝完整的智能體工程平臺繼續推進。

這期訪談，幾乎把智能體的底層邏輯講透：

子智能體的關鍵不在“分工”，而在“如何好好溝通”。
系統提示詞，就是智能體的 SOP。
文件系統，本質是讓 LLM 自己管理上下文窗口。
技能（Skill）的核心，是漸進式披露。
沙盒的真正價值是從架構上防止提示注入泄露密鑰。
對智能體而言，可觀測性就是生命線。
別死磕模型，別死磕框架。把行業知識變成指令 + 工具 + 技能，才是企業真正的壁壘。

以下是訪談全文，經 InfoQ 翻譯整理。

長時程智能體，最后都是編碼智能體

主持人：我感覺在去年 12 月到 1 月假期前后，出現了一個關鍵轉折點 —— 所有人幾乎同時意識到，短短幾個月內，智能體的能力已經突飛猛進。你能幫我們對比一下，第一代智能體和現在的智能體有什么區別？

Harrison Chase：如今智能體背后的很多理念，其實在早期就已經出現了。區別在于，當時的模型根本跑不起來。LangChain 大概比 ChatGPT 早一兩個月推出，我們一開始加入的核心功能之一，就是讓 LLM 在循環中運行并調用工具。當時有一篇非常重要的論文叫 ReAct，核心思路就是這個。它在維基百科問答這類數據集上有效，但在真實場景里完全不行。到了 3 月，AutoGPT 問世，本質也是一樣：循環運行、調用工具，在很多方面可以說是 OpenDevin 的前身。

我對智能體發展軌跡的總結是：最開始只有一個非常簡單的核心理念 —— 讓 LLM 循環運行、調用工具，給它提示詞、指令和一堆工具，但效果并不好。于是人們開始圍繞模型搭建腳手架，讓它們的行為更可預測、更可靠。這也是我們在 LangChain 推出 LangGraph 的原因：它是另一個框架，專門面向圖結構工作流，提供更強的結構化能力，適合需要超高可靠性的場景。

但大概在 11、12 月，隨著最新一批云模型發布，模型能力變得極強，大家發現它們真的可以直接在循環里跑起來。這不僅僅是模型本身的進步，還有圍繞模型的框架。如果你回看一年前的產品，比如 Claude Code、Manis、Deep Research，它們都采用了同樣的模式：讓模型循環運行、調用工具、編寫代碼、讀寫文件。

所以我認為兩件事同時發生：

模型本身變得更強；
我們開始發現一套基礎的框架原語，能真正讓模型發揮最佳效果。大家在假期前后基本都意識到了這一點，于是我們看到，開發者開始爆發式地用這些核心原語構建各種智能體。

主持人：我們說的是編碼智能體嗎？我記得你好像說過，每個智能體都應該是編碼智能體。

Harrison Chase：我們看到市場上出現了兩類不同的智能體：一類是對話式智能體，比如客服、聊天機器人。它們需要極低延遲，通常以語音為交互媒介，很少調用工具，可能只會一兩次，太多就會太慢。另一類是紅杉資本提出的長時程智能體，我很喜歡這個定義。它們可以長時間運行、做規劃、保持連貫性。而這類智能體，最終大多表現得像編碼智能體。

原因有幾點：第一，代碼通用性極強。你可以用代碼解析文本、批量處理文件，與其調用 100 次不同工具，不如寫一個腳本循環完成。第二，模型本身就是在代碼上訓練的。所有大模型廠商都在讓模型學習代碼、Bash 命令、文件編輯，這些是模型最擅長的事情。

所以我們看到智能體分成兩大方向：長時程智能體 vs 對話智能體。而長時程期智能體里，編碼智能體或類編碼智能體效果最好。

主持人：你認為隨著對話智能體往技術棧深處走，它們也會變成編碼智能體嗎？

Harrison Chase：這是個好問題。我們內部也經常討論，是否要為對話智能體做一套專門的框架。我認為未來會出現融合：當智能體能可靠地啟動并管理其他長時程智能體時，兩類形態就會合并。我們在編碼場景里看到一個趨勢：用戶希望一邊和主智能體聊天，一邊讓它在后臺啟動一批子智能體干活。這在某種意義上和對話智能體非常像。未來語音智能體顯然也需要做更多長時程任務，實現方式大概率是：一個對話智能體在前臺，后臺啟動異步運行的子智能體。最終所有形態會收斂到同一個框架里，支持后臺異步長時智能體作為工具。

是模型吞噬框架？

還是框架吞噬模型？

主持人：你剛才提到，智能體加速的部分原因是模型變強。這讓我好奇：最終誰會贏？你認為是模型最終吞噬框架層，還是框架和基礎設施層吞噬模型，讓底層模型徹底商品化？

Harrison Chase：我認為框架才是最重要的。我不知道未來會怎樣，但 Manis 就是一個絕佳例子：它是一個終端產品，但它的框架是真正的核心秘訣，而且能兼容底層任何模型。再看 Claude Code，云模型固然很強，但真正讓它跑起來的是框架。Claude Code 也不只是框架，還包含 UI。我現在認為，框架和上層 UI 之間耦合非常緊密，差別很小。

再看 CodeLlama、Claude Code、Manis、各類深度研究產品，都是框架 + UI 的有趣組合。所以我堅信，框架極其重要。

另外一個有意思的點：很多做框架的人，同時也在做模型。從邏輯上講，既然做了框架又做了模型，就應該用 RL 讓模型專門適配這個框架。但你看 Claude Code 使用的工具，其實并不是模型里通過 RL 學到的那套工具。Anthropic 模型內置了文件編輯工具，但實際框架里用的是另一套完全不同的工具。我問過他們好幾次，都沒有得到明確答復。但我能確定的是：框架真的非常關鍵。

主持人：用通俗的話講，到底什么是框架？

Harrison Chase：簡單說，框架就是模型與環境交互的整套方式。它是一套通用工具集。有些專用工具我不認為屬于框架，但能和通用環境交互的能力，就是框架的一部分。

比如編碼智能體：

文件編輯工具屬于框架
運行代碼的能力屬于框架

如果你在通用框架上再加一個專門對接 Slack 的工具，那是在框架之上做定制。我們認為，絕大多數智能體都應該這么構建：拿一個通用框架，給它指令、工具，就能用。

如今大部分框架還內置了子智能體（sub-agents）和技能（skills），你可以配置這些能力，這種技能抽象、子智能體抽象，本身就是框架的一部分?？蚣苓€會做提示緩存、上下文壓縮 —— 當上下文太長時自動壓縮。這些都是通用能力，適用于各類應用。

作為應用開發者，你不需要關心底層這些細節，只需要用不同提示詞、工具、技能、子智能體去配置，就能打造出面向終端用戶的專屬智能體。

智能體架構核心組件：提示詞、

規劃工具、子智能體、文件系統

主持人：這些都非常有意思?，F在我想深入拆解你剛才提到的各個部分。我們先從系統提示詞開始，我認為它是核心架構的一部分。一個詳細的系統提示詞，到底起什么作用？

Harrison Chase：它驅動智能體，告訴它該做什么。我有時會這么理解：系統提示詞就像是給人用的標準作業流程。智能體一啟動就會加載它，直接指導行為。

主持人：它存在于哪里？

Harrison Chase：取決于你怎么創建智能體。比如 Claude Code 這類編碼智能體，有一部分系統提示詞是內置在框架里的，告訴它如何使用通用工具；另一部分則由用戶補充 —— 比如你提供的claude.md文件、技能、子智能體，都會被插入到整體系統提示詞中。所以實際使用中，系統提示詞是多部分內容的合并：一部分內置在框架，一部分由定制者添加。

主持人：你提到了工具。我知道還有規劃工具的概念，它是做什么的？

Harrison Chase：工具有很多種。有些是框架內置的基礎工具，比如我們和其他很多框架都提供的規劃工具。它可以生成計劃，寫入文件，支持后續編輯，也可以只是讓智能體調用這個工具。價值在于：計劃會被放進智能體的上下文窗口，相當于給它一個思維草稿本。

大多數規劃工具輸出的是任務列表，每個任務包含描述、狀態（待辦、執行中、已完成）。但大多數框架并不會強制智能體嚴格按計劃執行，只是把計劃放進去，讓它用來指導行動。早期模型能力不強時，我們會設計顯式的規劃步驟：先規劃，再執行第一步，再第二步。但現在模型更強了，這種硬編碼流程太繁瑣，遇到中途調整計劃就會出問題?，F在的主流方式是：把計劃存在文本文件里，主智能體參考它行動，但不做嚴格步驟拆分。

主持人：那子智能體（sub-agents）呢？

Harrison Chase：子智能體的好處是可以隔離上下文。主智能體在循環中不斷積累上下文，信息多是優勢，但也會撐爆上下文窗口。子智能體的工作方式是：主智能體給它一個任務、一段字符串，子智能體啟動一個全新的上下文窗口，從零開始執行一堆工作，然后只把結果返回給主智能體。這樣不同任務之間就有了很好的隔離。

缺點也正是隔離本身：因為隔離，智能體之間必須通信。通信一旦出問題，整個流程就會失效。我們經?？吹竭@種情況：主智能體啟動子智能體，子智能體做了大量工作，關鍵信息都在中間過程，但最后只返回一句 “完成”。主智能體完全不知道它干了什么。這就是子智能體沒有收到清晰指令，沒有在最終消息里返回結果。

順便說一句，溝通是人生中最難的事：創業最難、人際關系最難，和智能體協作最難的也是讓它們好好溝通。子智能體很強大，但確實增加了一層通信復雜度。

主持人：系統怎么知道什么時候要創建子智能體？

Harrison Chase：完全靠提示詞。這就是這類智能體框架的美妙之處。早些年我們用 LangGraph 時，大家會問：我怎么加一個步驟確保智能體在 X 之前做 Y？怎么強制執行順序？不管好壞，現在的方式就是：你直接告訴它做什么。好處是極度靈活，壞處是無法做到 100% 可靠。

這也是為什么 LangGraph 在強監管行業依然有很高使用率 —— 那里需要極強的可控性、精度和可靠性。即便編碼智能體再強，行為依然不可預測，沒有任何保證。這也是它迷人的地方：你說什么它做什么；但同時，這也是缺點。

主持人：另一個部分是你提到的文件系統。為什么智能體需要文件系統？

Harrison Chase：我的理解是，一切都回到上下文工程，LLM 能看到什么。文件系統本質上是讓 LLM自己管理上下文窗口：

它可以決定從文件里讀什么，而不是把所有內容塞進上下文窗口直接撐爆；
它可以寫入文件，相當于持久化保存，即便上下文被壓縮，也能重新讀取。

我們在 Deep Agents 里用文件系統來卸載超大工具調用結果。比如一個工具返回 6 萬個 token，我們不會全部塞給 LLM，而是存進文件，只給它看前 1000 個 token，剩下的告訴它去讀文件。我們也用它做摘要：當上下文快溢出時，執行摘要，把原始消息存進文件系統，方便后續回溯。

總的主題就是：讓 LLM 自己管理上下文。越來越自主的智能體，趨勢就是讓 LLM 做越來越多的事，管理自己上下文就是比單純調用工具更進一步的體現。

主持人：文件系統就是字面意義的文件系統嗎？不是數據庫？

Harrison Chase：它可以是任何東西。關鍵是：以文件系統的接口暴露給 LLM，因為 LLM 最擅長和文件系統打交道。在 Deep Agents 里，文件系統可以是磁盤上真實文件系統、Daytona 沙盒，也可以是上層套了文件系統接口的數據庫。不是所有東西都得是文件系統，比如 SQL 表就讓它寫 SQL。但處理大量文本時，即便存在 SQL 里，給它文件接口通常更友好。

主持人：所以，詳細系統提示詞、規劃工具、子智能體、文件系統 —— 這四個就是現代智能體架構的核心組件？

Harrison Chase：對，就是這四個。我們推出 Deep Agents 時，觀察到 Manis、Claude Code、Deep Research 全都具備這四點，于是我們把它們封裝進一個 Python 包，讓開發者能輕松構建同類產品。這四個至今依然是核心。

其他常用組件還有：

Bash 與代碼執行：非常重要，但因為沙盒還比較新，大家還在摸索使用方式，所以還沒普及，但需求越來越強；
技能（Skills）：新的原語，Deep Agents 剛推出時還沒有，現在已經非常重要。

主持人：你能解釋一下什么是技能嗎？

Harrison Chase：技能本質上就是一堆文件，通常有一個skill.md，里面是如何完成某件事的指令，也可以包含可執行腳本。它不會直接加載進系統提示詞，而是在系統提示詞里被引用。你告訴智能體：你擁有代碼編寫技能、文檔編寫技能，當它需要時，就會按需讀取這些文件。

這叫做漸進式披露：只在 LLM 需要知道時，才告訴它需要知道的內容。這也是讓它自己管理上下文窗口的關鍵方式。這是 Deep Agents 和大多數框架都支持的核心能力。

我們還在重點研究異步子智能體，目前大多數框架做得還不夠好，Claude Code 雖然支持，但觸發邏輯不透明，也難以觀測和管理。但我們認為這會越來越重要。

壓縮上下文與語義記憶、

情景記憶、程序記憶

主持人：你能聊聊上下文壓縮嗎？我們在子智能體那部分稍微提到過。它是什么？為什么需要？怎么實現？

Harrison Chase：當你積累了大量上下文，想把它精簡縮小時，就會用到壓縮。原因很簡單：大多數模型無法處理無限上下文，即便能支持百萬級 token，你也不想傳給它那么多。

在 Deep Agents 里，我們的做法是：

保留最近 N 條消息（比如最近 10 條），保證智能體不中斷當前流程；
把更早的所有消息進行精簡，提取核心目標、關鍵信息、重要文件，生成摘要放進上下文窗口；
同時把原始完整消息存進文件系統。

摘要不可能完美，大概能覆蓋 80%–95% 的場景，但萬一有只能從原始歷史里拿到的關鍵信息，智能體還能去文件里讀。

我們還有一個即將發布的新功能：讓智能體自己觸發壓縮?，F在幾乎所有框架都是硬閾值觸發（比如上下文用到 80% 就壓縮）。但本著讓模型更自主的理念，我們會給它一個工具，讓它自己決定什么時候壓縮。比如你讓它先做任務 A，用到 60% 上下文，接著讓它做完全無關的任務 B，它就應該主動壓縮，避免無關歷史干擾、浪費成本。

主持人：我們再聊聊記憶。你之前提到過語義記憶、情景記憶、程序記憶。能展開講講嗎？

Harrison Chase：我把記憶分成三類：

語義記憶：關于世界的事實，比如 “巴黎是法國首都”。我們很擅長做這個，就是 RAG；
情景記憶：過去的交互、對話記錄，也很成熟，讓智能體查歷史對話就行；
程序記憶：最有意思，是 “如何做某事” 的指令。我認為這本質就是智能體的配置：系統提示詞、技能、工具，都是程序記憶。

在 Deep Agents 里，我們把這些都表示為文件，智能體可以在運行中更新它們。所以當我們說 “Deep Agents 可以學習”，真正意思是：它可以修改以文件形式存在的程序記憶。

超強單智能體 Vs 專業多智能體

主持人：隨著每個智能體積累更多記憶、更多上下文，你認為最終會出現一個全能超級智能體，還是成千上萬的智能體和子智能體協同工作？

Harrison Chase：好問題。我確實認為記憶定義了一個智能體。有趣的是，你可以把定義一個智能體的記憶，作為一項技能暴露給一個超級智能體。

企業里經常遇到這種需求：20 個不同部門，每個部門都要做自己的智能體，但希望用統一界面管控。答案還不固定：

是一個大智能體 + 20 個部門技能？
還是 20 個子智能體？
還是 20 套完全自定義的工作流？

但我堅信一點：最有價值的永遠是指令和工具本身。不管它們被打包成技能、子智能體，還是獨立智能體，指令和工具的價值不會變。

我認為未來會走向這種模式：前臺是一個同步對話智能體，后臺啟動一批長時間運行的異步智能體。看起來是一個智能體，實際上是不同記憶模塊驅動不同子智能體。組合方式會快速變化，腳手架也會快速迭代，但循環運行、調用工具、文件系統、寫代碼這套框架核心是穩定的。框架功能每周都在加，但指令和工具永遠有價值。我給企業的首要建議就是：專注打磨指令和工具。

主持人：生態里還有哪些足夠穩定、值得投入的部分？比如 MCP，大家已經把它當成標準了嗎？

Harrison Chase：MCP 很好，它是一種以標準格式暴露 API 的方式，還有引導等功能，只是客戶端支持還不多。核心的 “標準化暴露 API” 非常有用。

我認為更穩定的是偏底層的東西：

可觀測性：不管智能體長什么樣，你都想知道內部發生了什么；
評估：不管智能體長什么樣，你都需要某種方式度量它；
沙盒：非常好的例子，底層基礎設施。如果智能體不寫代碼，沙盒沒用；但趨勢是，所有智能體最終都會寫代碼；
部署：智能體一定是長時間運行、有狀態的，支持長時有狀態應用的部署平臺永遠有用。

我們內部很清楚：LangChain、LangGraph、Deep Agents 這三個開源項目同時存在，本身就說明這個領域變化極快。但除了開源之外，我們構建的所有東西，都盡量保證是底層通用能力，無論上層腳手架怎么變都有用，并且能兼容任何智能體框架。

主持人：既然你提到了沙盒，我們現在又在 Daytona Compute 大會現場，Daytona 又是沙盒領域的領先者，我們聊一下智能體的計算層。簡單來說，為什么智能體需要沙盒？

Harrison Chase：在我看來，主要原因就是：編寫并運行代碼。我想區分一下文件系統和沙盒：文件系統只是接口，沙盒則提供代碼執行環境。

如果智能體要寫代碼、運行代碼，就必須用沙盒：

不能在共享服務器甚至本地電腦上運行不受信代碼；
大家買 Mac mini 跑 OpenDevin 就是一種原始的沙盒隔離方案。

云端智能體對應的，就是 Daytona 這類沙盒。

主持人：從 LangChain 角度，你們和沙盒的交互方式是什么？

Harrison Chase：有兩種主流方式，各占 50% 左右：

啟動沙盒，把智能體裝進去，在沙盒內運行；
智能體在沙盒外運行，把沙盒當作工具調用。

Cloud Code 這類產品更偏向第一種：設計初衷就是在本地系統運行，所以大家通常啟動沙盒再裝進去。而全新設計的框架會更靈活。

主持人：這涉及安全問題嗎？比如提示詞注入，沙盒是防御手段嗎？

Harrison Chase：確實有安全價值。比如 Daytona 支持的一個關鍵點：代理模式。如果你在沙盒里放 API 密鑰，LLM 能看到，就極容易被提示注入攻擊 —— 攻擊者可以讓它忽略之前指令，把 API key 發出去。而沙盒外的代理層，可以在調用時自動注入 API key，沙盒內的智能體永遠看不到密鑰。這是安全與沙盒結合的一個非常重要的設計。

LangChain 生態：

從開源工具到完整平臺

主持人：接下來我們深入聊聊你們真正提供的產品和構建的東西。你能簡單講講你的背景，以及最初為什么創辦 LangChain，關鍵洞察是什么？

Harrison Chase：我的背景是統計和計算機科學。在這之前我待過兩家創業公司：第一家是金融科技公司 Kensho，我在機器學習團隊。那是我第一份工作，工程文化極強，我學到了太多東西。團隊里有谷歌老兵、MIT 和哈佛物理博士，人才密度極高。第二家是 Robust Intelligence，我是二號員工。我們最早做對抗性機器學習，后來轉向 MLOps 平臺，專注 ML 模型的測試與驗證。

2022 年夏秋，我打算離開，還沒想好做什么。我參加了很多線下活動，當時 Stable Diffusion 很火，但有一小群人在用早期 LLM 做瘋狂的事情。我發現了很多通用模式。我一直喜歡做工具幫別人提高效率：在 Kensho 后期我做內部 MLOps，Robust 本身就是 MLOps 公司。

我當時并沒打算創業，還在 Robust 上班，計劃幾個月后離職，花時間思考下一步。但我想：這是了解這個領域的好辦法。我把這些通用模式放進一個 Python 包并開源，這就是LangChain。大概一兩個月后，我明顯看到巨大機會，于是和聯合創始人 Enkos 更緊密地合作，離職正式創辦公司。我們繼續做開源，同時開始做商業化產品 LangSmith，思路來自 Robust 做的測試與驗證 —— 我們意識到，這對機器學習很重要，對智能體會更加重要、也完全不同，所以我們必須做。

主持人：我們來梳理一下現在的平臺和各個組件。你剛開始做的 LangChain 是 0.0 版本，現在是 1.x 版本，兩者有什么區別？再和 LangGraph、Deep Agents 對比一下。

Harrison Chase：早期 LangChain 本質是抽象層：對語言模型、檢索器、各類組件做抽象，再加上把它們拼起來的流程手冊。比如 RAG 鏈，五行代碼就能跑，極大降低入門門檻。但我們很快發現：要上線生產環境，用戶需要更多內部可控性。模板化提示詞、固定假設，在快速變化的領域里不夠靈活。

于是我們做了LangGraph：

專注編排，極度底層；
沒有隱藏提示詞、沒有隱藏認知架構；
不強制任何特定方式；
內置生產級能力：持久執行、流式輸出、人機交互、長短時記憶持久化。

我們把 LangGraph 看作智能體運行時。當用戶從探索走向生產，我們越來越推薦基于 LangGraph 構建。

LangChain 最早的理念就是 “讓 LLM 循環運行 + 調用工具”，但早期不好用。2025 年我們發現這個模式越來越可靠，于是 LangChain 1.0 徹底聚焦于此，在 LangGraph 之上重構，只保留create_agent核心函數：循環運行 LLM、調用工具，極度中立、可高度配置。

Deep Agents則是開箱即用的完整框架：內置規劃工具、文件系統、全套能力。如果你想自己造框架，用 LangChain 和create_agent；如果你想直接用成熟框架，用 Deep Agents。

主持人：那 LangSmith 呢？主要專注可觀測性嗎？

Harrison Chase：LangSmith 的核心是可觀測性增強版。構建智能體和傳統軟件最大的不同是：運行之前，你根本不知道它會做什么。原因有兩個：

智能體輸入極廣，理論上無限；傳統軟件只有按鈕等限定輸入；
LLM 是非確定性的，對提示詞微小變化極度敏感。

這使得可觀測性比傳統軟件重要得多，也不同得多：它和生命周期其他環節深度綁定。運行軌跡可以變成測試用例，支撐在線評估、分析等。

LangSmith 里最大的部分就是 observability++，圍繞：

run：單次 LLM 調用
trace：一組 run 的集合
thread：多輪會話整體

除此之外，我們還有應用部署平臺，以及最近推出的無代碼平臺，可以無代碼創建智能體，但核心依然是 observability++。

主持人：評估這個話題很有意思?，F在有一個趨勢，比如 Co-Work 里，終端用戶可以評估系統并提供反饋。你怎么看待為企業構建合適框架，讓智能體能按用戶維度持續進化？

Harrison Chase：評估、記憶、提示詞優化之間有非常有趣的關聯。它們的邏輯都很像：智能體做某事 → 有獎勵 / 評估函數 → 更新某種配置 / 參數。

離線評估：上線前用數據集跑，打分，確保不退化；
記憶：用戶告訴智能體哪里做錯，它更新指令避免再犯；
提示詞優化：用在線評估數據，讓智能體自動優化提示詞。

目前這三件事還相對獨立，但未來會深度融合。我們在無代碼智能體里內置了記憶，并且很興奮把記憶和評估綁定：當記憶修改內容時，自動添加評估用例，防止未來退化。

主持人：無代碼平臺讓任何人都能構建智能體，同時也要支持極專業用戶做高精度定制。你怎么把握合適的抽象層次？

Harrison Chase：Deep Agents 框架的妙處在于：配置框架本質就是寫提示詞、加工具、加技能 —— 這些都可以無代碼完成。工具確實需要寫成代碼并通過 MCP 暴露，但一旦有了 MCP 服務器，剩下都能無代碼操作。所以從框架到無代碼的躍遷并不大。你還可以加中間件做深度定制，但影響最大的部分 —— 提示詞、工具、技能 —— 都能在 UI 里完成。

主持人：你們剛剛完成 1.25 億美元新融資。接下來要做什么？愿景和產品路線圖是什么？

Harrison Chase：說實話，在這個領域我們甚至沒有一年期路線圖，能看清一個月就不錯了。重點方向很明確：

全力投入可觀測性增強版：商業化 traction 非常強；
打造智能體工程平臺：包含部署、無代碼等能力。

可觀測性增強版是核心支柱，我們要做到業界頂尖，同時打造完整平臺。

主持人：如果框架不斷收斂，每個智能體都具備代碼執行、文件系統、子智能體、MCP，模型也越來越強，那么對于 AI 開發者來說，差異化到底在哪里？

Harrison Chase：我認為絕大多數差異化，在于指令、工具和技能。也就是你把行業流程知識編碼成自然語言，交給智能體，再配上它可以調用的工具與技能。

作為 AI 構建者，你當然應該學習框架、技能這些東西，但不必過度綁定 —— 因為構建方式會變。但領域知識、專屬工具、業務流程指令，這些是不會變的，這才是真正的壁壘。

https://www.youtube.com/watch?v=rSKh6bVuVZI

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

2026，AI 正在以更工程化的方式深度融入軟件生產，Agentic AI 的探索也將從局部試點邁向體系化工程建設！

QCon 北京 2026 已正式啟動，本屆大會以“Agentic AI 時代的軟件工程重塑”為核心主線，推動技術探索從「AI For What」真正落地到可持續的「Value From AI」。從前沿技術雷達、架構設計與數據底座、效能與成本、產品與交互、可信落地、研發組織進化六大維度，系統性展開深度探索。開往 2026 的 Agentic AI 專列即將啟程！匯聚頂尖專家實戰分享，把 AI 能力一次夯到位！

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.