網易首頁 > 網易號 > 正文申請入駐

實測Kimi首個Agent：智能體與模型之間的區隔消失了？

2025-06-23 13:01:16　來源: 直面派

北京舉報

分享至

這兩天，月之暗面上線了名為 Kimi-Researcher 的產品，以“模型即Agent”的思路切入，標志著其在 Agent 路線上的一次明顯發力。

如果大家還記得的話，就在 Kimi 發布的前一天，MiniMax 在 MiniMax Week 的第三天也啟動了通用 Agent 的灰度測試。這兩家此前一度低調的公司幾乎在同一時段重新進入公眾視野，也讓原本趨于平靜的 AI 四小強格局再次活躍起來。

Kimi、MiniMax、智譜、階躍星辰，這幾位曾經在大模型初期階段高頻出現的名字，如今正借助 Agent 的新賽道尋找新的突破口。不管是技術報告的更新、產品形態的演進，還是實際功能的迭代，幾家廠商都在以各自的節奏向外界釋放信號。

這一輪產品集中露面的時間節點并非巧合。從時機上看，這一波集中亮相并非偶然。當前，大模型正從純粹的問答工具演進為具備自主規劃、任務執行與上下文記憶能力的智能體系統。Agent 正在從“增強生產力”轉向“替代部分人類任務角色”。對于具備模型研發和產品整合能力的廠商來說，這是一次相對公平的新起點。

報告，不只是寫完，還得像

在這樣的背景下，Kimi 推出的 Kimi-Researcher 選擇了一個很明確的切入口：深度研究。

這個定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問答，而是瞄準了原本需要專業助理團隊完成的任務，例如梳理產業政策、比對跨國法規、生成調研報告等。

這類任務對模型的檢索、思考、組織、判斷能力要求極高，幾乎是對 Agent 體系的全方位考驗。

話不多說，我們直接開測。

比如說我想讓它分析下2025年上半年黃金價格波動與美聯儲政策走向的關聯性。

它沒有立刻開始寫，而是反問了我一些問題，從研究邏輯本身出發，主動確認這個任務到底該怎么做才不空轉。

這種主動澄清機制，是過去在 Deep Research（左圖展示為：ChatGPT的 research 模式）里很熟悉的，也不像 MiniMax （右圖展示為MiniMax Agent）那種一口氣跑完所有流程后才看結果的虛擬機結構，更接近一個“你提一個話題，它開始一步步推”的助研模型。

Kimi比GPT更貼心增添了“Include everything”按鈕，不是單純放開信息源，而是直接把它切換到一種更傾向生成完整結構報告的工作狀態。

經過大概十幾分鐘的等待，它一共生成了兩種版本。

一種是我們熟悉的文字版研究報告，段落結構清晰，語氣沉穩，整體邏輯偏向內容層次 + 政策推導；另一種則是自動渲染的 HTML 格式報告，已經配好封面、標題、摘要、分節說明，標注出“核心發現”“關鍵風險”“歷史規律”這些結構化小標簽。

網頁稿鏈接在這，有興趣的朋友們可以打開看一看：

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108

內容還是很豐富的。

對經常要做對內材料和對外匯報的人來說，這種“寫+排+渲”一體的體驗，確實提高了交付效率。

你可以把它當成是Word+Notion+研究助理的混合體，不僅能輸出內容，還知道怎么讓內容看起來像一份真的報告。

然后我們也測了測生成PPT的能力。給它的任務是這樣的：

梳理一下 Stable Diffusion 從最初發布到最新版本的演進路線，列出各階段關鍵改進與社區貢獻節點，并作出PPT

看起來是一個非常結構化的問題，理論上應該正對 Researcher 的下懷。但實際操作過程中，我們也發現了一些限制。

1. 當前版本仍未支持多任務并行（當然，這可能只是內測階段的限制，正式版是否優化還有待觀察。）

2. 并不能生成傳統PPT，只能是 HTML 格式報告。

我們還是把report鏈接放在這里：

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108

不過也不能說它表現不好。作為一個學術型Agent，它在報告里自動加上了參考文獻鏈接，并用下劃線標注出處。可以完成一整套可交付內容。

而這，恰恰就是很多 AI 工具還停留在段落生成時無法做到的部分。

但當我們把這個任務交給 MiniMax Agent 時，體驗就完全不同了：

它不僅生成了 PPT，還一并打包了 PDF 報告、Markdown 研究文檔、圖表文件、項目任務表（todo.md）和用于可視化的 Python 腳本。

你可以下載 .pptx 源文件，二次修改內容和格式。也能查看 .md 的版本記錄、調圖的 .py 腳本，每一階段的中間產物全都可查。

從產出形式來看，它給你的是一整個PPT 制作系統，而不是一份靜態報告。

Kimi-Researcher和

MiniMax Agent，哪個更適合你

從執行力上來說，兩者都已經遠超傳統意義上的聊天機器人——你不用再一句一句提示，它們可以自己補全問題、拆解任務，甚至按你沒說出口的邏輯推下去。但使用下來，兩者的Agent 感其實來自不同的方向。

Kimi-Researcher 是任務導向的，它的邏輯很清楚：你給我一個研究型問題，我就像一個訓練過的助理那樣，問你三件事、查五份資料、最后給你一份成稿。

但 MiniMax 不太一樣。

它更像一個運行在虛擬機里的多工系統——你可以把它理解成你裝了一個干活的人，但這個人是你組裝出來的。他自己并不主張“要做研究”還是“要做運營”，而是你怎么設計，他就按你的指令一步步走。有時候你會覺得，它像是個開著調試模式的智能體，你能看到它每一步調用了什么插件、在哪個頁面抓了數據、用了哪個文檔里的知識。這種透明度很高的體驗，本質上更像是你操控一個流程機器人，而不是和一個人打交道。

如果說 Kimi 是把一個智能體藏在了模型背后，讓你感受到結果；那 MiniMax 更像是把智能體攤開在你眼前，讓你參與構建過程。兩者誰更強，不一定，但它們帶來的使用心智是完全不一樣的。

還有一個重要差別，是默認角色設定。

Kimi 很明顯是自帶性格的——不夸張地說，它的Researcher標簽決定了它的行為方式，比如它更關注嚴謹表達、更傾向于做出規范排版、更容易使用資料比對視角進行總結。

而 MiniMax 給你的更多是空角色模板——你自己來寫 prompt，自己搭建鏈路，它才啟動真正的 Agent 能力。

我不是說哪個更好，我只是說它們在實現Agent這件事上，走的是完全不同的路徑。

在我們深度體驗兩者后，給出用戶一句話結論：如果你更在意“我提個需求就能直接拿到結果”，Kimi 會是更順手的選擇；但如果你希望掌控整個任務的執行流程、甚至自己定義智能體的邏輯結構，那 MiniMax 可能更適合你。

Kimi 做結果，MiniMax 做過程

說到底，Kimi 和 MiniMax 的這次同步出招，看起來像是在做 Agent，其實是在做一次底層策略切換。

Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設計這些 Developer 套路，它不是在鼓勵你搭建 Agent，而是干脆告訴你：“Agent 本身就是模型的一部分了”。你想研究政策，它就用研究員的方式回應你。它把智能體的控制權從用戶界面撤回到了模型內部，交給了系統自動調度。

這一點是很多人沒意識到的。

過去我們理解的智能體，是我來設計、我來組合，但 Kimi 的思路是，你不需要設計，你只要告訴我你要什么結果，我來決定應該找誰干活、用什么方法、怎么安排流程。

它把整個 Agent 系統做成了一個黑箱，你丟任務進去，它自己完成任務拆解、插件調用、資料組織和內容生成。就像你發了封工作郵件，過一陣就能收到一份干凈利落的文檔回復。

很多人還在找插件入口，Kimi 已經在去插件化。

這兩種產品方向的不同，其實也能看出背后公司在策略上的側重點。Kimi 一直強調“長文本”能力和“系統性表達”，在 Researcher 這個產品上被推到極致，它更注重交付內容的完整性和邏輯性。

Kimi不是做開發者平臺，它要做的是“懂結構、能調度”的模型本體。這也解釋了為什么它一上來就定位在最復雜的研究類任務，因為這種任務能最大程度激活它預設的 Agent 內部機制：澄清問題、檢索并行、結構統籌、表達生成。這不是讓你看到它能干什么，而是逼你意識到，你其實可以不再親自干。

這點對用戶心智的沖擊，其實比 MiniMax 更強。

MiniMax 反而是最像 Agent的那一個。你真的可以看到它調用了哪些函數，爬了哪些網頁，引用了哪段語料，它給你一個完整的操作軌道，你像是在 Debug 一個機器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當成 Agent 的 IDE ——你是工程師，它是執行層。

但這個過程中，大多數用戶其實是有門檻的。

你需要理解：插件怎么綁定、變量怎么配置、路徑怎么切換、長文本怎么緩存……你得像在搭一個流程工廠。而 Kimi 則直接告訴你：“你什么都不用管，只要告訴我要結果。”

這個差別說到底，是兩家公司對智能體未來形態的不同下注。

MiniMax 賭的是：AI 應該成為一個流程平臺，你來決定它長成什么樣。

Kimi 賭的是：AI 應該直接成為一個能干事的角色，讓你不再需要流程本身。

這兩條路背后的預設完全不同。一個相信每個用戶都該擁有自己的Agent，一個相信模型應該成為能自動執行復雜任務的交付體。

Kimi 是在重新定義什么是工具，MiniMax 是在放大工具能到多深。

這場Agent戰役其實不是從用戶開始的，而是從怎么分配任務這件事開始的。而這，恰恰是大模型能力真正能走入現實的起點。

你以為你在選一個Agent工具，其實你在決定的是：你愿不愿意把解決問題的方式，也一并交給它。

歡迎在評論區留言~
如需開白請加小編微信：dongfangmark

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.