網易首頁 > 網易號 > 正文申請入駐

Kimi Agent產品很厲害，然后呢？

2026-03-02 15:09:06　來源: 親愛的數據

北京舉報

分享至

眨眼間，2026年2月了，

AI界的春節，

真的是模型下餃子。

當下，有三件事值得看，

1. ClaudeOpus4.6（閉源）

+Claude Sonnet 4.6（閉源）

2. GPT-5.3-Codex（閉源）

+ Germini 3.1 Pro（閉源）

3. KimiAgent產品

+Kimi K2.5模型（開源）

畢竟，閉源模型能知道的不多，

也就開源的有技術報告可以挖挖。

這一次，我和以下專家進行討論：

武漢人工智能研究院研究員朱貴波博士，

華為盤古大模型核心算法工程師，

阿里云無影AgentBay工程師，

波士頓動力（Boston Dynamics）強化學習算法工程師，

一位Kimi的產品同學。

我尊重專家的匿名意愿。

幾個核心觀察，

1.Agentic模型已是當下主流，打法是啥？

有別于此前（約12個月前）的推理模型，

大模型公司沒有拿得出手的這類Agentic模型，

面子砸在地板上。那打法是啥？

第一，如果模型與產品的協同得不好，

模型就會替代產品，

甚至“蠶食”產品功能。

Cursor被ClaudeCode賦予了更強的產品能力，

但是ClaudeCode出來也快干掉Cursor了。

包括Claude Cowork問世，

也干掉了一些創業公司。

模型能力增長干掉產品，干掉創業公司，

在AI圈不是新聞。

當然，Agentic模型還有更大的甜點，

在于和MaaS平臺協同，這個此處按下不表，

另篇他論。

第二，模型和產品協同得好，

模型讓產品贏在起跑線。

Agentic模型為提高了產品贏的概率，

產品經理有機會做出更強的產品，

因為，內建的“執行能力”在處理復雜任務上，

比從產品層面處理，高了一個維度。

Agentic模型的這種訓練，

不僅有目的，而且有針對性，

這個思路的效果，在KimiAgent產品上能看到。

整體上，是存在模型往上螺旋上升，

蠶食產品的現象，

所以，產品只能被逼著繼續往上去卷新的場景。

但是到底哪個速度更快？

哪個影響力更大？尚未定論。

2.很多老金礦的價值，誰都不能低估。

第一，強化學習是口老金礦，

單輪反饋強化學習卷完，卷Agentic RL，

Kimi和Anthropic在卷群體智能強化學習，

Opus 4.6模型和Kimi K2.5模型都用到了。

群體智能強化學習思路很簡潔，

但是怎么實現成為關鍵，

理論牛不牛似乎不在是決定性，

誰能用極致工程能力做出來，

在更大的規模上做出來，效果好，誰才牛。

第二，與視覺模態融合也是老金礦，

視覺給模型加持能力，

本質是模態融合得好，

理解能力進一步提高，

場景價值也能突顯，

比如，Agent這個場景，

它會因為視覺的存在更加智能。

篇幅有限，挑重點講，后面再寫。

Agentic模型到底在卷什么？

先談Agentic模型，

也就是專注Agent的這種，

不是光吐字那種，

比如，KimiAgent在辦公場景

（牛馬大戰PDF/Excel等），

直接6到飛起。

不用Ctrl+C按到手抽筋了，

這里的干活是指動手干辦公室臟活累活（任務），

不是吐字寫稿那種。

我有一個word列表，每年都整理，

文章標題，發稿時間，閱讀量，點贊數……

全年的量也不少，

再讓我手動粘成excel表，

想得美，

我的耐心，

已經在做Word文件的時候用完了。

這事必須AI來。

好處享受了，看看原理。

Kimi K2.5模型開源了，還配有技術報告：

《Kimi K2.5: Visual Agentic Intelligence》。‘

Kimi的節奏一向很快，

早在2025年11月中旬，

Kimi Agent的底層模型，

還是Kimi K2 Thinking模型，

到2025年12月的時候，

Kimi的Agent模式的底層模型是

Kimi K2.5。

可以看到，K2.5是典型的Agentic模型。

這模型有啥好？

當然，我可以捏著鼻子，

學ChatGPT說話：

“這類大模型性能的提升，

標志著人工智能向自主，

深度思考，工具協作的方向邁出了重要一步。”

Agentic模型為啥強？

在我眼里，大模型的本質就是，

你喂給它啥，它就會啥。

你想讓它會使用工具，

那就給它喂調用工具的數據。

當下是這類模型的時間窗口期，

廠商為了搶奪排位，又不少花錢，

沒有萬卡，很難加入戰斗。

而譚老師我買Claude Code會員的錢，

都快要辦分期了。

造的人和用的人都狠狠花錢，

AI再繼續漲價，人類可能要從昂貴的AI手里，

把失去的工作搶回來了。

聊完錢，再聊能力。

Agentic能力變強到底指啥能力變強？

指的是模型在干活的時候，

如何自己拿主意干活，

如何分步驟思考

如何把活干完，

數據就需要是：

工具怎么調用來的？調用的結果是啥？

你想讓它按步驟干活，

那干的活需要分哪幾個步驟等等。

總結下來就是：

第一，干活前，分解規劃：拆任務，拆步驟；

第二，多個工具一起干活，

該用哪個工具，還用得好。

第三，在相對長的時間內，執行多輪交互的任務。

第四，任務中，能來回調整，干出好結果。

這四個能力怎么訓練得到，就得廠商各自摸索。

常見的技術：

多任務管理、跨模態處理、長時推理。

目標都是提高模型干活時的能力。

過程就是把干活的那個結果寫訓練到模型里面。

Kimi產品同學說得很中肯，

“Kimi的Agent模式有了智能體的這種智能感”，

他也謙虛地說：

“但是，絕大多數有生產力價值的這種場景，

其實AI還是沒有服務得很好。

最核心的是，把模型能力做好，

排在對產品差異化的考慮之前。”

聽他這么說，相信Kimi內部，

對于模型和產品的博弈哲學有很深的思考。

強化學習這口老金礦，Kimi怎么挖的？

智能體從串行到并行了？

不能這么說。為此，

我請教了波士頓動力公司強化學習算法工程師，

他這樣告訴我：

群體智能（Swam）不是新概念。

本質上，智能體可以是一個比較強的中央式系統。

而這種多智能體系統是什么樣的呢？

首先，有一個比較強的中央系統，

再加上一堆執行器，

你可以理解為，它大腦很強。

但是，實際去執行工作的那些末端，

是飛機也好，是機器人也好，

甚至是一些小東西，

比如這些個程序也好，

所執行的東西并不復雜。

像Anthropic公司的Opus 4.6那樣，

它主要的工作其實是調度各種模型的過程。

這個調度本身并不復雜，

關鍵在于每個模型本身的執行能力，

這些模型每個都非常強大。

以前的智能體，每個智能體的算力可能沒那么強，

更多是依靠“大腦”來給它們詳細具體指令，

甚至包括一些細微的操作。

指導不細，干不好。

現在的這種智能體，你可以理解為，

它們之間的交流，

更像更接近于人與人之間的交流方式了。

這是因為本體智能的能力的上限不斷提升，

同時，能夠完成的任務周期時間也會越來越長。

所以說，智能體通過這樣的協作的模式的轉變，

辦事方式有變化。

過去的智能體怎么辦事呢？

一個智能體在那吭哧吭哧搞很久很久。

但是，這么玩是有上限的，

任務的復雜度不可能是非常高。

而現在挑戰不同了，

寫一個編譯器（Compiler）。

那么復雜的工作，僅僅通過一條提示詞，

或者說現在單個智能體能干的活，

以前的智能體做不到，因為上難度了。

編譯器現在被Anthropic做到了，

雖然這是一個昂貴實驗（2萬美元）。

在這個背景下的話，

你如何把多個智能體的智力按什么方式融合。

我覺得，在這個時間點上的話，

大家都已經在往這個群體智能的方向去想了。

另外，本質上，

這也是一種Scaling（規模擴展）技術.

過去，我們在擴展能力時，

主要是通過增加模型的上下文長度

（Context length），

和擴展模型的參數量來實現。

現在，擴展的重點變成了增加智能體的數量。

以前有過討論：如果我投入相同的算力，

是應該擴展智能體的數量，

還是應該擴大每個子智能體的規模，

讓它們具備更強的記憶能力？

這兩種方式大家都探索過很多，

很值得繼續討論，

如果你有好觀點，也歡迎探討交流。

再細看Kimi K2.5，

會發現一個有意思的點：

K2.5的Agent Swarm，

有一個Orchestrator（可訓練編排器）

每個智能體都被分配了具體的任務。

比如，AI研究員、物理研究員、

生命科學研究員等，

這是中心化的思路。

每個智能體的訓練目標是幫助整體群體完成任務，

而不是單獨優化自身行為。

這個獎勵函數用來衡量群體任務完成的質量，

由三個方面組成。

首先是并行度，任務越多、

智能體能同時完成的子任務越多，獎勵就越高。

其次是每個子任務完成的情況，

任務完成得越好，獎勵越高。

最后是整體任務的完成情況，

如果整體任務成功了，獎勵就越大。

獎勵也不是簡單的累計。

并行度和子任務完成度兩個方面的獎勵

有兩個權重，一個叫λ1，一個叫λ2。

接下來調整權重，

最后，還是以總體任務的成功率為準，給獎勵。

另外，資源限制方面，就是任務也不能無限多。

而Kimi K2.5訓練數據的獲取方式，

主要是通過合成的方式，

即拿到“提示詞訓練集”（Prompt Construction）。

Kimi K2.5展現了群體智能的潛力，

好巧不巧，這點和Opus 4.6，

“英雄所干略同”。

視覺是一等公民了嗎？

我們接著聊，

譚老師我歷來把視覺作為重點，

從未敢輕視。

有文章為證《2023年終盤點：圖文大模型編年簡史》

Kimi K2.5也把視覺視為重點，

你在知乎上好好看看Kimi的VLM算法小哥哥寫的感想，

發自內心的成就感，噴薄而出。

反觀有的大廠，GitHub口碑真是不忍直視。

其實，Kimi K2.5技術報告有幾個重點：

一個是視覺，一個是群體智能；

你說是什么超級革新的方法嗎？

表面上看都不是，

專家笑談：“這個方法雖然大家都知道，

但是真正訓出來的，也沒幾家。”

我始終認為，視覺是一個要死磕的技術路線，

最堅定的追隨者，非谷歌Gemini莫屬，

人家從頭到尾，一路死磕融合。

Nano、Banana這些小模型做PPT，

畫圖、文生圖效果賊穩，

現在連學生寫論文都用Gemini畫流程圖了

那些字、那些示意框，比以前準太多。

提示詞遵循得特別好，

畫流程圖時字在哪、

箭頭怎么指都明明白白。

這也是同一棵果樹上摘的果子（重視視覺融合）。

Kimi這次也是摘到果子了。

他們的算法工程師，

不認為K2.5是一個傳統意義上的VLM。

MoonViT這個架構，

對前序工作借鑒的基礎上，

數據上下的功夫也不少，

扛住了預訓練視覺數據15T總訓練量的規模，

圖片是2維，視頻3維，

給視覺提供了多一維度的信息量，

只要能處理的好額外學習時序和動態這部分獨特的能力，

性能可按預期提升。

K2.5所用的方法，

總是深思熟慮且實用，

比如，用一個極小的輸入來激活視覺能力，

這樣不僅有效，

且避免了傳統方法中，

對大量視覺數據的依賴。

通過冷啟動，讓模型能夠迅速啟動視覺能力，

使得視覺信息直接融入到文本推理過程當中。

用有限的數據量，

激活視覺能力。

這樣，有了K2 Thinking的能力，

（也就是上一版發純文本模型的能力），

視覺能力強，

Tool use能力也很強。

力圖多訓練出一個維度，

性能就上一個大臺階。

雖然阿里Qwen模型先發優勢極大，

而Kimi呈現出強勢的追趕勢頭。

有好看的了。

One More thing

思考得科幻一些，

AI寫代碼的產品從第一天起，

就是Agent形態的，

未來，代碼模型和Agent模型，

是否可能會匯合成一套，

反正模型也是把API視為工具的一種，

如果匯合成為一個大類，

而這一類大大有別于大語言模型，

也就是說，這兩類可能會走出模型差異化的道路。

AI的世界，卷卷更精彩。

（放一些PPT成果）

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

AI創業，已經沒有“出海”這個詞了丨量子位沙龍

量子位 2026-04-06 13:00:41
0 跟貼 0
智能體上線就翻車？AWS 這款 “質檢神器”，幫你把 Agent 穩穩送上生產線

鈦媒體APP 2026-04-06 08:38:20
0 跟貼 0

讓離線強化學習從「局部描摹」變「全局布局」丨ICLR'26

量子位 2026-04-06 13:33:32
0 跟貼 0

讓兩個大模型在線吵架，跑通全網95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0
MiniMax來承包你的桌面了-4

機器之心Pro 2026-01-20 20:19:42
0 跟貼 0

大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

AI學會左腳踩右腳自進化？Meta華人新研究改寫Agent法則

新智元 2026-04-06 12:42:55
0 跟貼 0
卡帕西引爆硅谷！公開「第二大腦」黑科技，1250萬人圍觀

新智元 2026-04-05 15:33:38
53 跟貼 53

中國創造一門新編程語言的黃金時代來了？

虎嗅APP 2025-12-23 03:54:05
38 跟貼 38
毫秒級搜索10億生物序列！騰訊×浙大合作推出最強生物序列搜索AI工具——ERAST

生物世界 2026-04-06 15:07:19
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
科氪 | 榮耀與京東簽訂戰略合作協議推進AI、機器人、C2M共創合作

36氪 2026-04-06 17:56:42
0 跟貼 0
逼AI當山頂洞人！Claude防話癆插件爆火，網友：受夠了AI廢話

新智元 2026-04-06 17:13:12
0 跟貼 0
男子打球超帥瞬間，離了很遠直接把球打進了球筐

南陽日報 2026-04-05 19:53:53
254 跟貼 254
Agent接管EDA工作流，不只寫腳本！浙大打通真實芯片設計閉環

新智元 2026-04-06 12:43:01
0 跟貼 0
Claude Code Harness+龍蝦科研團來了！金字塔分層架構+多智能體

量子位 2026-04-06 14:30:03
0 跟貼 0
陳光標賣勞斯萊斯捐了1000萬元:張雪未來見面提車

都市快報橙柿互動 2026-04-05 16:58:33
6404 跟貼 6404
修好五億系統卻遭賴賬，我留下后門靜靜看它倒計時崩潰

曉艾故事匯 2026-04-06 14:21:52
0 跟貼 0
這機器人也太過分了吧，居然還上床睡覺，請把她的眼鏡安上！

古德拜街拍 2026-04-04 16:53:33
0 跟貼 0
性能真的不重要了嗎？Jeff Dean給出反常答案

新智元 2025-12-28 17:20:51
0 跟貼 0
喬任梁父親首談兒子離世細節：房間里的藥散落一地，早有隱隱不安

娛慧 2026-04-06 09:11:43
3 跟貼 3
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2639 跟貼 2639
這啥算法

一只小太陽 2026-04-06 03:07:55
0 跟貼 0
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
遼寧男籃又要啟動換帥程序了？烏戈用人引質疑！末節戰術安排崩盤

國足未贏夠 2026-04-04 08:10:22
0 跟貼 0
高手在民間女生，展示啤酒花式開瓶，這得喝多少才有這技術！

搞怪藝術家 2026-04-04 16:18:03
1 跟貼 1
生命是大模型，但不僅僅是大語言模型

尹燁 2026-04-02 01:16:27
0 跟貼 0
聯想去年收入破六千億，Windows AI PC份額全球第一

快科技 2026-04-05 15:11:31
0 跟貼 0
老公說“春假就是讓孩子休息的”——然后呢？

學習不費媽 2026-04-02 09:30:31
9 跟貼 9
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
爆火！把智能體當游戲角色來玩，一個人就是一個公司

機器之心Pro 2026-02-12 18:04:44
0 跟貼 0
2026京津冀（廊坊）算力算法大賽倒計時2天

新浪財經 2026-04-06 12:27:09
0 跟貼 0
被機器人代替的下崗工人，該何去何從？以后失業的人會越來越多

小狗漫說 2026-04-02 16:47:23
0 跟貼 0
徐州“公廁版瑞幸”火出圈，景區工作人員回應：曾是游客服務點而非公廁

現代快報 2026-04-04 15:00:11
1207 跟貼 1207
喬任梁父母首度公開細節，兒子死因復雜，別墅里全是藥，早有預兆

秋風悲畫芯 2026-04-06 12:48:44
46 跟貼 46
上海人山人海！排隊3公里，等候長達380分鐘！各大地標又爆了，上海名場面再現外灘；多地景區宣布，限流、停止售票

上觀新聞 2026-04-06 06:16:28
149 跟貼 149
張雪機車剛火，就有人站出來懷疑張雪用他技術奪冠！我真無語了！

東方碩果 2026-04-06 03:55:19
5 跟貼 5
堵死中國所有后門！美國兩黨深夜發新規，聯手日荷絞殺AI芯片制造

安珈使者啊 2026-04-06 14:41:17
3 跟貼 3

值40萬元！甘肅農民為報仇套住一只殺了吃，5年后轉手賣出皮和骨

米果說識

2026-04-05 16:43:44

釋永信“開光”真相大白，過程不堪入目，易中天也被牽連

往史過眼云煙

2026-03-24 17:05:24

宋寧峰退圈了，張婉婷企圖公開照片，Q女士把聊天記錄全曬了出來

童叔不飆車

2026-04-06 00:09:28

南京博物院事件真相來了：果然，那些人真狗啊！

李月亮

2026-02-10 20:58:01

常務副縣長的下一步是去哪？接任縣長的只占少數

王吉尼

2026-04-06 16:50:01

原來她是喬欣媽媽，二婚嫁上海豪門托舉女兒，難怪她能成人生贏家

興史興談

2026-04-05 16:31:58

不怪國內那么多人想娶她，確實漂亮。

情感大頭說說

2026-04-05 18:05:23

1938年老蔣制造黃河決堤，日軍淹死數量驚人，真實情況你可能不信

浩舞默畫

2026-04-06 09:22:04

6歲女童失蹤后續：有新線索，知情人士曝更多細節，父母反被波及

小娛樂悠悠

2026-04-06 09:54:49

十余輛汽車在金華高速被貨車遺落的鐵片扎爆胎，高速管理處：已找到貨車司機

瀟湘晨報

2026-04-06 16:42:16

離譜！郭艾倫被好友詐騙千萬，已正式報案，周琦有先見之明

多特體育說

2026-04-06 11:08:02

連續7個跌停板！股民：牛市中的熊股！

數據挖掘分析

2026-04-06 16:18:16

劉詩雯抵達海南正式就職，新崗位及待遇首度曝光

乒乓助手

2026-04-06 00:04:58

鄭麗文訪陸前夕，第一道難關出現，解放軍蓄勢待發，公布促統海報

今墨緣

2026-04-06 16:18:10

少量油輪和貨船通過霍爾木茲海峽：包括一艘載有伊拉克原油的油輪，一艘日本液化天然氣運輸船，一艘法國集裝箱船等

大風新聞

2026-04-06 14:04:10

戴偉浚謝鵬飛同夜閃光司機被打臉叭叭響球迷：你伏特加喝多了？

刀鋒體育

2026-04-06 09:02:01

《馬力歐2》創2026開畫紀錄！首周橫掃約600億日元

游民星空

2026-04-06 18:07:08

特朗普大清洗行動：90后秘書或被炒，萊維特拍馬屁求自保

圓夢的小老頭

2026-04-05 21:05:23

《生化9》格蕾絲"大奶牛"MOD：極品大雷身材太火爆

游民星空

2026-04-05 12:06:10

李在明萬萬沒想到，被判無期的尹錫悅，竟能比當總統還掙得多

流史歲月

2026-04-06 18:00:05

親愛的數據

《我看見了風暴：人工智能基建革命》一書作者

693文章數 219913關注度

往期回顧全部

科技要聞

前同事被蒸餾成Token，AI能否偷走職場經驗

頭條要聞

外媒：美國副總統萬斯和伊朗外長等人徹夜交流

頭條要聞

外媒：美國副總統萬斯和伊朗外長等人徹夜交流

體育要聞

球員系列賽大滿貫！趙心童10-3世界第一加冕賽季第4冠

娛樂要聞

喬任梁離世10年父母曝舞臺光鮮的背后

財經要聞

史詩級暴跌"一周年" A股接下來如何走？

汽車要聞

阿維塔06T快上市了旅行車還能這么玩？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

藝術

親子

健康

房產

手機 / 數碼

房產 / 家居

Kimi Agent產品很厲害，然后呢？

前同事被蒸餾成Token，AI能否偷走職場經驗

外媒：美國副總統萬斯和伊朗外長等人徹夜交流

外媒：美國副總統萬斯和伊朗外長等人徹夜交流

球員系列賽大滿貫！趙心童10-3世界第一 加冕賽季第4冠

喬任梁離世10年 父母曝舞臺光鮮的背后

史詩級暴跌"一周年" A股接下來如何走？

阿維塔06T快上市了 旅行車還能這么玩？

態度原創

只要100塊錢！無敵幸運淘到絕版的AMD RX 6950 XT旗艦顯卡

草書入門的“最強寶典”！因內容太妙，作者不敢留名，比學王羲之都靠譜

今年幼兒園的招生真的是壓力巨大啊 前兩天開全園大會

干細胞抗衰4大誤區,90%的人都中招

小陽春全面啟動！現房，才是這波行情里最穩的上車票

球員系列賽大滿貫！趙心童10-3世界第一加冕賽季第4冠

喬任梁離世10年父母曝舞臺光鮮的背后

阿維塔06T快上市了旅行車還能這么玩？

今年幼兒園的招生真的是壓力巨大啊前兩天開全園大會