337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

模型不再是關鍵?LangChain 創始人:真正決定Agent 上限的是運行框架

0
分享至


作者 | 允毅

伴隨模型能力持續躍遷,簡單調用 LLM API、套一層提示詞就能做產品的時代,已經走到盡頭。

AI 應用正在從“單次生成”,邁向“持續執行”。下一代軟件系統,不再只是把大模型接進工作流,而是圍繞一層全新的 agent orchestration 架構展開:它負責讓智能體自主規劃、調用工具、編寫代碼、管理文件、壓縮上下文、調度子智能體,并在長時程任務中保持連貫行動。

這也意味著:簡單封裝 AI 的時代正式結束,整個軟件基礎設施層,正在被重新書寫。

剛剛完成 1.25 億美元新融資的 LangChain,正是這場浪潮的定義者之一。其創始人 Harrison Chase 在最新一期播客中圍繞 “到底是模型吞噬框架,還是框架吞噬模型” 的行業爭論,直接指出“框架才是未來,模型終將走向商品化”。

在這場對話里,他首次清晰定義出現代智能體的四大核心組件:系統提示詞、規劃工具、子智能體、文件系統,這是目前業界最統一的 “標準架構”。

面對未來趨勢是超強單智能體還是專業多智能體協作,他認為最有價值的永遠是指令和工具本身。

他自曝當初創建 LangChain,正是看準了 LLM 循環調用工具的巨大潛力。從早期開源框架,到 LangGraph、Deep Agents、LangSmith 再到 Agent Builder,LangChain 自身也完成了從 “實驗玩具” 到 “生產級智能體運行時” 的蛻變。

Harrison Chase 透露,LangChain 接下來的核心方向很明確:一邊押注商業化表現最強的可觀測性,一邊補齊部署與無代碼能力,朝完整的智能體工程平臺繼續推進。

這期訪談,幾乎把智能體的底層邏輯講透:

  • 子智能體的關鍵不在“分工”,而在“如何好好溝通”。

  • 系統提示詞,就是智能體的 SOP。

  • 文件系統,本質是讓 LLM 自己管理上下文窗口。

  • 技能(Skill)的核心,是漸進式披露。

  • 沙盒的真正價值是從架構上防止提示注入泄露密鑰。

  • 對智能體而言,可觀測性就是生命線。

  • 別死磕模型,別死磕框架。把行業知識變成指令 + 工具 + 技能,才是企業真正的壁壘。

以下是訪談全文,經 InfoQ 翻譯整理。

長時程智能體,最后都是編碼智能體

主持人:我感覺在去年 12 月到 1 月假期前后,出現了一個關鍵轉折點 —— 所有人幾乎同時意識到,短短幾個月內,智能體的能力已經突飛猛進。你能幫我們對比一下,第一代智能體和現在的智能體有什么區別?

Harrison Chase:如今智能體背后的很多理念,其實在早期就已經出現了。區別在于,當時的模型根本跑不起來。LangChain 大概比 ChatGPT 早一兩個月推出,我們一開始加入的核心功能之一,就是讓 LLM 在循環中運行并調用工具。當時有一篇非常重要的論文叫 ReAct,核心思路就是這個。它在維基百科問答這類數據集上有效,但在真實場景里完全不行。到了 3 月,AutoGPT 問世,本質也是一樣:循環運行、調用工具,在很多方面可以說是 OpenDevin 的前身。

我對智能體發展軌跡的總結是:最開始只有一個非常簡單的核心理念 —— 讓 LLM 循環運行、調用工具,給它提示詞、指令和一堆工具,但效果并不好。于是人們開始圍繞模型搭建腳手架,讓它們的行為更可預測、更可靠。這也是我們在 LangChain 推出 LangGraph 的原因:它是另一個框架,專門面向圖結構工作流,提供更強的結構化能力,適合需要超高可靠性的場景。

但大概在 11、12 月,隨著最新一批云模型發布,模型能力變得極強,大家發現它們真的可以直接在循環里跑起來。這不僅僅是模型本身的進步,還有圍繞模型的框架。如果你回看一年前的產品,比如 Claude Code、Manis、Deep Research,它們都采用了同樣的模式:讓模型循環運行、調用工具、編寫代碼、讀寫文件。

所以我認為兩件事同時發生:

  1. 模型本身變得更強;

  2. 我們開始發現一套基礎的框架原語,能真正讓模型發揮最佳效果。大家在假期前后基本都意識到了這一點,于是我們看到,開發者開始爆發式地用這些核心原語構建各種智能體。

主持人:我們說的是編碼智能體嗎?我記得你好像說過,每個智能體都應該是編碼智能體。

Harrison Chase:我們看到市場上出現了兩類不同的智能體:一類是對話式智能體,比如客服、聊天機器人。它們需要極低延遲,通常以語音為交互媒介,很少調用工具,可能只會一兩次,太多就會太慢。另一類是紅杉資本提出的長時程智能體,我很喜歡這個定義。它們可以長時間運行、做規劃、保持連貫性。而這類智能體,最終大多表現得像編碼智能體

原因有幾點:第一,代碼通用性極強。你可以用代碼解析文本、批量處理文件,與其調用 100 次不同工具,不如寫一個腳本循環完成。第二,模型本身就是在代碼上訓練的。所有大模型廠商都在讓模型學習代碼、Bash 命令、文件編輯,這些是模型最擅長的事情。

所以我們看到智能體分成兩大方向:長時程智能體 vs 對話智能體。而長時程期智能體里,編碼智能體或類編碼智能體效果最好。

主持人:你認為隨著對話智能體往技術棧深處走,它們也會變成編碼智能體嗎?

Harrison Chase:這是個好問題。我們內部也經常討論,是否要為對話智能體做一套專門的框架。我認為未來會出現融合:當智能體能可靠地啟動并管理其他長時程智能體時,兩類形態就會合并。我們在編碼場景里看到一個趨勢:用戶希望一邊和主智能體聊天,一邊讓它在后臺啟動一批子智能體干活。這在某種意義上和對話智能體非常像。未來語音智能體顯然也需要做更多長時程任務,實現方式大概率是:一個對話智能體在前臺,后臺啟動異步運行的子智能體。最終所有形態會收斂到同一個框架里,支持后臺異步長時智能體作為工具。

是模型吞噬框架?

還是框架吞噬模型?

主持人:你剛才提到,智能體加速的部分原因是模型變強。這讓我好奇:最終誰會贏?你認為是模型最終吞噬框架層,還是框架和基礎設施層吞噬模型,讓底層模型徹底商品化?

Harrison Chase:我認為 框架才是最重要的。我不知道未來會怎樣,但 Manis 就是一個絕佳例子:它是一個終端產品,但它的框架是真正的核心秘訣,而且能兼容底層任何模型。再看 Claude Code,云模型固然很強,但真正讓它跑起來的是框架。Claude Code 也不只是框架,還包含 UI。我現在認為,框架和上層 UI 之間耦合非常緊密,差別很小。

再看 CodeLlama、Claude Code、Manis、各類深度研究產品,都是框架 + UI 的有趣組合。所以我堅信,框架極其重要。

另外一個有意思的點:很多做框架的人,同時也在做模型。從邏輯上講,既然做了框架又做了模型,就應該用 RL 讓模型專門適配這個框架。但你看 Claude Code 使用的工具,其實并不是模型里通過 RL 學到的那套工具。Anthropic 模型內置了文件編輯工具,但實際框架里用的是另一套完全不同的工具。我問過他們好幾次,都沒有得到明確答復。但我能確定的是:框架真的非常關鍵

主持人:用通俗的話講,到底什么是框架?

Harrison Chase:簡單說,框架就是模型與環境交互的整套方式。它是一套通用工具集。有些專用工具我不認為屬于框架,但能和通用環境交互的能力,就是框架的一部分。

比如編碼智能體:

  • 文件編輯工具屬于框架

  • 運行代碼的能力屬于框架

如果你在通用框架上再加一個專門對接 Slack 的工具,那是在框架之上做定制。我們認為,絕大多數智能體都應該這么構建:拿一個通用框架,給它指令、工具,就能用。

如今大部分框架還內置了子智能體(sub-agents)和技能(skills),你可以配置這些能力,這種技能抽象、子智能體抽象,本身就是框架的一部分??蚣苓€會做提示緩存、上下文壓縮 —— 當上下文太長時自動壓縮。這些都是通用能力,適用于各類應用。

作為應用開發者,你不需要關心底層這些細節,只需要用不同提示詞、工具、技能、子智能體去配置,就能打造出面向終端用戶的專屬智能體。

智能體架構核心組件:提示詞、

規劃工具、子智能體、文件系統

主持人:這些都非常有意思?,F在我想深入拆解你剛才提到的各個部分。我們先從系統提示詞開始,我認為它是核心架構的一部分。一個詳細的系統提示詞,到底起什么作用?

Harrison Chase:它驅動智能體,告訴它該做什么。我有時會這么理解:系統提示詞就像是給人用的標準作業流程。智能體一啟動就會加載它,直接指導行為。

主持人:它存在于哪里?

Harrison Chase:取決于你怎么創建智能體。比如 Claude Code 這類編碼智能體,有一部分系統提示詞是內置在框架里的,告訴它如何使用通用工具;另一部分則由用戶補充 —— 比如你提供的claude.md文件、技能、子智能體,都會被插入到整體系統提示詞中。所以實際使用中,系統提示詞是多部分內容的合并:一部分內置在框架,一部分由定制者添加。

主持人:你提到了工具。我知道還有規劃工具的概念,它是做什么的?

Harrison Chase:工具有很多種。有些是框架內置的基礎工具,比如我們和其他很多框架都提供的規劃工具。它可以生成計劃,寫入文件,支持后續編輯,也可以只是讓智能體調用這個工具。價值在于:計劃會被放進智能體的上下文窗口,相當于給它一個思維草稿本。

大多數規劃工具輸出的是任務列表,每個任務包含描述、狀態(待辦、執行中、已完成)。但大多數框架并不會強制智能體嚴格按計劃執行,只是把計劃放進去,讓它用來指導行動。早期模型能力不強時,我們會設計顯式的規劃步驟:先規劃,再執行第一步,再第二步。但現在模型更強了,這種硬編碼流程太繁瑣,遇到中途調整計劃就會出問題?,F在的主流方式是:把計劃存在文本文件里,主智能體參考它行動,但不做嚴格步驟拆分。

主持人:那子智能體(sub-agents)呢?

Harrison Chase:子智能體的好處是可以隔離上下文。主智能體在循環中不斷積累上下文,信息多是優勢,但也會撐爆上下文窗口。子智能體的工作方式是:主智能體給它一個任務、一段字符串,子智能體啟動一個全新的上下文窗口,從零開始執行一堆工作,然后只把結果返回給主智能體。這樣不同任務之間就有了很好的隔離。

缺點也正是隔離本身:因為隔離,智能體之間必須通信。通信一旦出問題,整個流程就會失效。我們經??吹竭@種情況:主智能體啟動子智能體,子智能體做了大量工作,關鍵信息都在中間過程,但最后只返回一句 “完成”。主智能體完全不知道它干了什么。這就是子智能體沒有收到清晰指令,沒有在最終消息里返回結果。

順便說一句,溝通是人生中最難的事:創業最難、人際關系最難,和智能體協作最難的也是讓它們好好溝通。子智能體很強大,但確實增加了一層通信復雜度。

主持人:系統怎么知道什么時候要創建子智能體?

Harrison Chase完全靠提示詞。這就是這類智能體框架的美妙之處。早些年我們用 LangGraph 時,大家會問:我怎么加一個步驟確保智能體在 X 之前做 Y?怎么強制執行順序?不管好壞,現在的方式就是:你直接告訴它做什么。好處是極度靈活,壞處是無法做到 100% 可靠。

這也是為什么 LangGraph 在強監管行業依然有很高使用率 —— 那里需要極強的可控性、精度和可靠性。即便編碼智能體再強,行為依然不可預測,沒有任何保證。這也是它迷人的地方:你說什么它做什么;但同時,這也是缺點。

主持人:另一個部分是你提到的文件系統。為什么智能體需要文件系統?

Harrison Chase:我的理解是,一切都回到上下文工程,LLM 能看到什么。文件系統本質上是讓 LLM自己管理上下文窗口

  • 它可以決定從文件里讀什么,而不是把所有內容塞進上下文窗口直接撐爆;

  • 它可以寫入文件,相當于持久化保存,即便上下文被壓縮,也能重新讀取。

我們在 Deep Agents 里用文件系統來卸載超大工具調用結果。比如一個工具返回 6 萬個 token,我們不會全部塞給 LLM,而是存進文件,只給它看前 1000 個 token,剩下的告訴它去讀文件。我們也用它做摘要:當上下文快溢出時,執行摘要,把原始消息存進文件系統,方便后續回溯。

總的主題就是:讓 LLM 自己管理上下文。越來越自主的智能體,趨勢就是讓 LLM 做越來越多的事,管理自己上下文就是比單純調用工具更進一步的體現。

主持人:文件系統就是字面意義的文件系統嗎?不是數據庫?

Harrison Chase:它可以是任何東西。關鍵是:以文件系統的接口暴露給 LLM,因為 LLM 最擅長和文件系統打交道。在 Deep Agents 里,文件系統可以是磁盤上真實文件系統、Daytona 沙盒,也可以是上層套了文件系統接口的數據庫。不是所有東西都得是文件系統,比如 SQL 表就讓它寫 SQL。但處理大量文本時,即便存在 SQL 里,給它文件接口通常更友好。

主持人:所以,詳細系統提示詞、規劃工具、子智能體、文件系統 —— 這四個就是現代智能體架構的核心組件?

Harrison Chase:對,就是這四個。我們推出 Deep Agents 時,觀察到 Manis、Claude Code、Deep Research 全都具備這四點,于是我們把它們封裝進一個 Python 包,讓開發者能輕松構建同類產品。這四個至今依然是核心。

其他常用組件還有:

  • Bash 與代碼執行:非常重要,但因為沙盒還比較新,大家還在摸索使用方式,所以還沒普及,但需求越來越強;

  • 技能(Skills):新的原語,Deep Agents 剛推出時還沒有,現在已經非常重要。

主持人:你能解釋一下什么是技能嗎?

Harrison Chase:技能本質上就是一堆文件,通常有一個skill.md,里面是如何完成某件事的指令,也可以包含可執行腳本。它不會直接加載進系統提示詞,而是在系統提示詞里被引用。你告訴智能體:你擁有代碼編寫技能、文檔編寫技能,當它需要時,就會按需讀取這些文件。

這叫做漸進式披露:只在 LLM 需要知道時,才告訴它需要知道的內容。這也是讓它自己管理上下文窗口的關鍵方式。這是 Deep Agents 和大多數框架都支持的核心能力。

我們還在重點研究異步子智能體,目前大多數框架做得還不夠好,Claude Code 雖然支持,但觸發邏輯不透明,也難以觀測和管理。但我們認為這會越來越重要。

壓縮上下文與語義記憶、

情景記憶、程序記憶

主持人:你能聊聊上下文壓縮嗎?我們在子智能體那部分稍微提到過。它是什么?為什么需要?怎么實現?

Harrison Chase:當你積累了大量上下文,想把它精簡縮小時,就會用到壓縮。原因很簡單:大多數模型無法處理無限上下文,即便能支持百萬級 token,你也不想傳給它那么多。

在 Deep Agents 里,我們的做法是:

  1. 保留最近 N 條消息(比如最近 10 條),保證智能體不中斷當前流程;

  2. 把更早的所有消息進行精簡,提取核心目標、關鍵信息、重要文件,生成摘要放進上下文窗口;

  3. 同時把原始完整消息存進文件系統。

摘要不可能完美,大概能覆蓋 80%–95% 的場景,但萬一有只能從原始歷史里拿到的關鍵信息,智能體還能去文件里讀。

我們還有一個即將發布的新功能:讓智能體自己觸發壓縮?,F在幾乎所有框架都是硬閾值觸發(比如上下文用到 80% 就壓縮)。但本著讓模型更自主的理念,我們會給它一個工具,讓它自己決定什么時候壓縮。比如你讓它先做任務 A,用到 60% 上下文,接著讓它做完全無關的任務 B,它就應該主動壓縮,避免無關歷史干擾、浪費成本。

主持人:我們再聊聊記憶。你之前提到過語義記憶、情景記憶、程序記憶。能展開講講嗎?

Harrison Chase:我把記憶分成三類:

  1. 語義記憶:關于世界的事實,比如 “巴黎是法國首都”。我們很擅長做這個,就是 RAG;

  2. 情景記憶:過去的交互、對話記錄,也很成熟,讓智能體查歷史對話就行;

  3. 程序記憶:最有意思,是 “如何做某事” 的指令。我認為這本質就是智能體的配置:系統提示詞、技能、工具,都是程序記憶。

在 Deep Agents 里,我們把這些都表示為文件,智能體可以在運行中更新它們。所以當我們說 “Deep Agents 可以學習”,真正意思是:它可以修改以文件形式存在的程序記憶

超強單智能體 Vs 專業多智能體

主持人:隨著每個智能體積累更多記憶、更多上下文,你認為最終會出現一個全能超級智能體,還是成千上萬的智能體和子智能體協同工作?

Harrison Chase:好問題。我確實認為記憶定義了一個智能體。有趣的是,你可以把定義一個智能體的記憶,作為一項技能暴露給一個超級智能體。

企業里經常遇到這種需求:20 個不同部門,每個部門都要做自己的智能體,但希望用統一界面管控。答案還不固定:

  • 是一個大智能體 + 20 個部門技能?

  • 還是 20 個子智能體?

  • 還是 20 套完全自定義的工作流?

但我堅信一點:最有價值的永遠是指令和工具本身。不管它們被打包成技能、子智能體,還是獨立智能體,指令和工具的價值不會變。

我認為未來會走向這種模式:前臺是一個同步對話智能體,后臺啟動一批長時間運行的異步智能體。看起來是一個智能體,實際上是不同記憶模塊驅動不同子智能體。組合方式會快速變化,腳手架也會快速迭代,但循環運行、調用工具、文件系統、寫代碼這套框架核心是穩定的。框架功能每周都在加,但指令和工具永遠有價值。我給企業的首要建議就是:專注打磨指令和工具。

主持人:生態里還有哪些足夠穩定、值得投入的部分?比如 MCP,大家已經把它當成標準了嗎?

Harrison Chase:MCP 很好,它是一種以標準格式暴露 API 的方式,還有引導等功能,只是客戶端支持還不多。核心的 “標準化暴露 API” 非常有用。

我認為更穩定的是偏底層的東西:

  • 可觀測性:不管智能體長什么樣,你都想知道內部發生了什么;

  • 評估:不管智能體長什么樣,你都需要某種方式度量它;

  • 沙盒:非常好的例子,底層基礎設施。如果智能體不寫代碼,沙盒沒用;但趨勢是,所有智能體最終都會寫代碼;

  • 部署:智能體一定是長時間運行、有狀態的,支持長時有狀態應用的部署平臺永遠有用。

我們內部很清楚:LangChain、LangGraph、Deep Agents 這三個開源項目同時存在,本身就說明這個領域變化極快。但除了開源之外,我們構建的所有東西,都盡量保證是底層通用能力,無論上層腳手架怎么變都有用,并且能兼容任何智能體框架。

主持人:既然你提到了沙盒,我們現在又在 Daytona Compute 大會現場,Daytona 又是沙盒領域的領先者,我們聊一下智能體的計算層。簡單來說,為什么智能體需要沙盒?

Harrison Chase:在我看來,主要原因就是:編寫并運行代碼。我想區分一下文件系統和沙盒:文件系統只是接口,沙盒則提供代碼執行環境。

如果智能體要寫代碼、運行代碼,就必須用沙盒:

  • 不能在共享服務器甚至本地電腦上運行不受信代碼;

  • 大家買 Mac mini 跑 OpenDevin 就是一種原始的沙盒隔離方案。

云端智能體對應的,就是 Daytona 這類沙盒。

主持人:從 LangChain 角度,你們和沙盒的交互方式是什么?

Harrison Chase:有兩種主流方式,各占 50% 左右:

  1. 啟動沙盒,把智能體裝進去,在沙盒內運行;

  2. 智能體在沙盒外運行,把沙盒當作工具調用。

Cloud Code 這類產品更偏向第一種:設計初衷就是在本地系統運行,所以大家通常啟動沙盒再裝進去。而全新設計的框架會更靈活。

主持人:這涉及安全問題嗎?比如提示詞注入,沙盒是防御手段嗎?

Harrison Chase:確實有安全價值。比如 Daytona 支持的一個關鍵點:代理模式。如果你在沙盒里放 API 密鑰,LLM 能看到,就極容易被提示注入攻擊 —— 攻擊者可以讓它忽略之前指令,把 API key 發出去。而沙盒外的代理層,可以在調用時自動注入 API key,沙盒內的智能體永遠看不到密鑰。這是安全與沙盒結合的一個非常重要的設計。

LangChain 生態:

從開源工具到完整平臺

主持人:接下來我們深入聊聊你們真正提供的產品和構建的東西。你能簡單講講你的背景,以及最初為什么創辦 LangChain,關鍵洞察是什么?

Harrison Chase:我的背景是統計和計算機科學。在這之前我待過兩家創業公司:第一家是金融科技公司 Kensho,我在機器學習團隊。那是我第一份工作,工程文化極強,我學到了太多東西。團隊里有谷歌老兵、MIT 和哈佛物理博士,人才密度極高。第二家是 Robust Intelligence,我是二號員工。我們最早做對抗性機器學習,后來轉向 MLOps 平臺,專注 ML 模型的測試與驗證。

2022 年夏秋,我打算離開,還沒想好做什么。我參加了很多線下活動,當時 Stable Diffusion 很火,但有一小群人在用早期 LLM 做瘋狂的事情。我發現了很多通用模式。我一直喜歡做工具幫別人提高效率:在 Kensho 后期我做內部 MLOps,Robust 本身就是 MLOps 公司。

我當時并沒打算創業,還在 Robust 上班,計劃幾個月后離職,花時間思考下一步。但我想:這是了解這個領域的好辦法。我把這些通用模式放進一個 Python 包并開源,這就是LangChain。大概一兩個月后,我明顯看到巨大機會,于是和聯合創始人 Enkos 更緊密地合作,離職正式創辦公司。我們繼續做開源,同時開始做商業化產品 LangSmith,思路來自 Robust 做的測試與驗證 —— 我們意識到,這對機器學習很重要,對智能體會更加重要、也完全不同,所以我們必須做。

主持人:我們來梳理一下現在的平臺和各個組件。你剛開始做的 LangChain 是 0.0 版本,現在是 1.x 版本,兩者有什么區別?再和 LangGraph、Deep Agents 對比一下。

Harrison Chase:早期 LangChain 本質是抽象層:對語言模型、檢索器、各類組件做抽象,再加上把它們拼起來的流程手冊。比如 RAG 鏈,五行代碼就能跑,極大降低入門門檻。但我們很快發現:要上線生產環境,用戶需要更多內部可控性。模板化提示詞、固定假設,在快速變化的領域里不夠靈活。

于是我們做了LangGraph

  • 專注編排,極度底層;

  • 沒有隱藏提示詞、沒有隱藏認知架構;

  • 不強制任何特定方式;

  • 內置生產級能力:持久執行、流式輸出、人機交互、長短時記憶持久化。

我們把 LangGraph 看作智能體運行時。當用戶從探索走向生產,我們越來越推薦基于 LangGraph 構建。

LangChain 最早的理念就是 “讓 LLM 循環運行 + 調用工具”,但早期不好用。2025 年我們發現這個模式越來越可靠,于是 LangChain 1.0 徹底聚焦于此,在 LangGraph 之上重構,只保留create_agent核心函數:循環運行 LLM、調用工具,極度中立、可高度配置。

Deep Agents則是開箱即用的完整框架:內置規劃工具、文件系統、全套能力。如果你想自己造框架,用 LangChain 和create_agent;如果你想直接用成熟框架,用 Deep Agents。

主持人:那 LangSmith 呢?主要專注可觀測性嗎?

Harrison Chase:LangSmith 的核心是可觀測性增強版。構建智能體和傳統軟件最大的不同是:運行之前,你根本不知道它會做什么。原因有兩個:

  1. 智能體輸入極廣,理論上無限;傳統軟件只有按鈕等限定輸入;

  2. LLM 是非確定性的,對提示詞微小變化極度敏感。

這使得可觀測性比傳統軟件重要得多,也不同得多:它和生命周期其他環節深度綁定。運行軌跡可以變成測試用例,支撐在線評估、分析等。

LangSmith 里最大的部分就是 observability++,圍繞:

  • run:單次 LLM 調用

  • trace:一組 run 的集合

  • thread:多輪會話整體

除此之外,我們還有應用部署平臺,以及最近推出的無代碼平臺,可以無代碼創建智能體,但核心依然是 observability++。

主持人:評估這個話題很有意思?,F在有一個趨勢,比如 Co-Work 里,終端用戶可以評估系統并提供反饋。你怎么看待為企業構建合適框架,讓智能體能按用戶維度持續進化?

Harrison Chase:評估、記憶、提示詞優化之間有非常有趣的關聯。它們的邏輯都很像:智能體做某事 → 有獎勵 / 評估函數 → 更新某種配置 / 參數。

  • 離線評估:上線前用數據集跑,打分,確保不退化;

  • 記憶:用戶告訴智能體哪里做錯,它更新指令避免再犯;

  • 提示詞優化:用在線評估數據,讓智能體自動優化提示詞。

目前這三件事還相對獨立,但未來會深度融合。我們在無代碼智能體里內置了記憶,并且很興奮把記憶和評估綁定:當記憶修改內容時,自動添加評估用例,防止未來退化。

主持人:無代碼平臺讓任何人都能構建智能體,同時也要支持極專業用戶做高精度定制。你怎么把握合適的抽象層次?

Harrison Chase:Deep Agents 框架的妙處在于:配置框架本質就是寫提示詞、加工具、加技能 —— 這些都可以無代碼完成。工具確實需要寫成代碼并通過 MCP 暴露,但一旦有了 MCP 服務器,剩下都能無代碼操作。所以從框架到無代碼的躍遷并不大。你還可以加中間件做深度定制,但影響最大的部分 —— 提示詞、工具、技能 —— 都能在 UI 里完成。

主持人:你們剛剛完成 1.25 億美元新融資。接下來要做什么?愿景和產品路線圖是什么?

Harrison Chase:說實話,在這個領域我們甚至沒有一年期路線圖,能看清一個月就不錯了。重點方向很明確:

  • 全力投入可觀測性增強版:商業化 traction 非常強;

  • 打造智能體工程平臺:包含部署、無代碼等能力。

可觀測性增強版是核心支柱,我們要做到業界頂尖,同時打造完整平臺。

主持人:如果框架不斷收斂,每個智能體都具備代碼執行、文件系統、子智能體、MCP,模型也越來越強,那么對于 AI 開發者來說,差異化到底在哪里?

Harrison Chase:我認為絕大多數差異化,在于指令、工具和技能。也就是你把行業流程知識編碼成自然語言,交給智能體,再配上它可以調用的工具與技能。

作為 AI 構建者,你當然應該學習框架、技能這些東西,但不必過度綁定 —— 因為構建方式會變。但領域知識、專屬工具、業務流程指令,這些是不會變的,這才是真正的壁壘。

https://www.youtube.com/watch?v=rSKh6bVuVZI

聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。

會議推薦

2026,AI 正在以更工程化的方式深度融入軟件生產,Agentic AI 的探索也將從局部試點邁向體系化工程建設!

QCon 北京 2026 已正式啟動,本屆大會以“Agentic AI 時代的軟件工程重塑”為核心主線,推動技術探索從「AI For What」真正落地到可持續的「Value From AI」。從前沿技術雷達、架構設計與數據底座、效能與成本、產品與交互、可信落地、研發組織進化六大維度,系統性展開深度探索。開往 2026 的 Agentic AI 專列即將啟程!匯聚頂尖專家實戰分享,把 AI 能力一次夯到位!

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網傳《雄獅少年》出品方倒閉,當年懟網友,終于為自己的行為買單

網傳《雄獅少年》出品方倒閉,當年懟網友,終于為自己的行為買單

八卦南風
2026-03-27 17:17:39
老板身家是曼城老板10倍,卻連億級標王都不敢買?最有錢的老板,卻成了最摳的土豪?

老板身家是曼城老板10倍,卻連億級標王都不敢買?最有錢的老板,卻成了最摳的土豪?

慢歌輕步謠
2026-03-30 07:25:31
今晚別換臺!3月30日兩大衛視好劇追不停

今晚別換臺!3月30日兩大衛視好劇追不停

手工制作阿殲
2026-03-30 07:42:43
1937年地主王學文救下女紅軍還收留了她的孩子,徹底改變三個家庭

1937年地主王學文救下女紅軍還收留了她的孩子,徹底改變三個家庭

磊子講史
2026-01-14 16:09:59
“下周將被部署的美國士兵在脫衣舞俱樂部揮霍,很年輕,像胎兒一樣”

“下周將被部署的美國士兵在脫衣舞俱樂部揮霍,很年輕,像胎兒一樣”

觀察者網
2026-03-30 13:21:06
臺灣地區,長期阻礙中國統一就是馬英九。這個人非常之狡猾!

臺灣地區,長期阻礙中國統一就是馬英九。這個人非常之狡猾!

安安說
2026-03-28 11:40:47
真正好消息!中國大陸將有2家企業,能制造7nm芯片了?

真正好消息!中國大陸將有2家企業,能制造7nm芯片了?

互聯網.亂侃秀
2026-03-28 14:19:21
新歡就是出軌對象!他又要當爸了,當年的“小三”成功上位了!

新歡就是出軌對象!他又要當爸了,當年的“小三”成功上位了!

BenSir本色說
2026-03-12 22:22:16
烏媒:中國推出極其危險的TM-300隱身無人機,最大航程達1200公里

烏媒:中國推出極其危險的TM-300隱身無人機,最大航程達1200公里

零度Military
2026-03-27 06:37:33
陳奕迅現身單依純演唱會,全程黑臉還睡著,網友:替李榮浩監場?

陳奕迅現身單依純演唱會,全程黑臉還睡著,網友:替李榮浩監場?

潮鹿逐夢
2026-03-30 12:50:49
伊朗民眾:美國應該放棄腦子里的霸權幻想

伊朗民眾:美國應該放棄腦子里的霸權幻想

都市快報橙柿互動
2026-03-30 17:39:42
太原高層大樓起火26死傷:官方三次更新傷亡人數,一畫面信息量大

太原高層大樓起火26死傷:官方三次更新傷亡人數,一畫面信息量大

博士觀察
2026-03-29 14:54:04
太陽報:哈蘭德花40萬鎊買了一輛限量款邁巴赫,全球僅150輛

太陽報:哈蘭德花40萬鎊買了一輛限量款邁巴赫,全球僅150輛

懂球帝
2026-03-30 11:56:04
奪命電飯煲已被曝光!煮米進去秒變毒藥,內膽是肝癌催化劑?

奪命電飯煲已被曝光!煮米進去秒變毒藥,內膽是肝癌催化劑?

健康科普365
2026-03-29 17:25:11
俄烏戰場傳來血的教訓,我們最先進的殲20,不能再抱著火箭彈不放

俄烏戰場傳來血的教訓,我們最先進的殲20,不能再抱著火箭彈不放

安安說
2026-03-28 11:54:14
悲哀!網友哭訴兒子月薪9000,在家吃住,一分生活費卻都不愿承擔

悲哀!網友哭訴兒子月薪9000,在家吃住,一分生活費卻都不愿承擔

火山詩話
2026-03-29 11:23:13
普通人存100萬要多久?

普通人存100萬要多久?

黎兜兜
2026-03-30 10:50:43
張凌赫團隊急了?素顏熱搜洗白失敗遭群嘲,網友呼吁嚴查背后資本

張凌赫團隊急了?素顏熱搜洗白失敗遭群嘲,網友呼吁嚴查背后資本

萌神木木
2026-03-29 16:02:23
跳過郭晶晶!霍中妍正臉曝光,完美復刻奶奶朱玲玲,太絕了

跳過郭晶晶!霍中妍正臉曝光,完美復刻奶奶朱玲玲,太絕了

可樂談情感
2026-03-30 13:07:58
馬卡報關注西班牙人:2026年來聯賽0勝卻無需保級,堪稱奇景

馬卡報關注西班牙人:2026年來聯賽0勝卻無需保級,堪稱奇景

懂球帝
2026-03-30 15:41:07
2026-03-30 18:12:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1397文章數 143關注度
往期回顧 全部

科技要聞

一句謊言引發的硅谷血案

頭條要聞

尹正發文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

頭條要聞

尹正發文恭喜張雪奪冠 張雪:沒錢請您做代言人 送臺車

體育要聞

想進世界杯,意大利還要過他這一關

娛樂要聞

單依純凌晨發長文道歉!李榮浩再回應

財經要聞

本輪地緣沖突,A股憑什么走出獨立行情

汽車要聞

理想i9要來了!外形似小號MEGA 能沖擊高端純電市場?

態度原創

健康
親子
藝術
數碼
軍事航空

干細胞抗衰4大誤區,90%的人都中招

親子要聞

兒科護士精準控場,孩子哭得收放自如

藝術要聞

600 年前的「產亡孤魂」,藏著中國女性最痛的記憶

數碼要聞

雙塔合一,酷凜推出FROZN A620 SLK風冷散熱器

軍事要聞

第三艘航母出動數千名士兵抵達 美軍大舉增兵中東戰場

無障礙瀏覽 進入關懷版