337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

實測Kimi首個Agent:智能體與模型之間的區隔消失了?

0
分享至


這兩天,月之暗面上線了名為 Kimi-Researcher 的產品,以“模型即Agent”的思路切入,標志著其在 Agent 路線上的一次明顯發力。


如果大家還記得的話,就在 Kimi 發布的前一天,MiniMax 在 MiniMax Week 的第三天也啟動了通用 Agent 的灰度測試。這兩家此前一度低調的公司幾乎在同一時段重新進入公眾視野,也讓原本趨于平靜的 AI 四小強格局再次活躍起來。


Kimi、MiniMax、智譜、階躍星辰,這幾位曾經在大模型初期階段高頻出現的名字,如今正借助 Agent 的新賽道尋找新的突破口。不管是技術報告的更新、產品形態的演進,還是實際功能的迭代,幾家廠商都在以各自的節奏向外界釋放信號。

這一輪產品集中露面的時間節點并非巧合。從時機上看,這一波集中亮相并非偶然。當前,大模型正從純粹的問答工具演進為具備自主規劃、任務執行與上下文記憶能力的智能體系統。Agent 正在從“增強生產力”轉向“替代部分人類任務角色”。對于具備模型研發和產品整合能力的廠商來說,這是一次相對公平的新起點。

01

報告,不只是寫完,還得像

在這樣的背景下,Kimi 推出的 Kimi-Researcher 選擇了一個很明確的切入口:深度研究。

這個定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問答,而是瞄準了原本需要專業助理團隊完成的任務,例如梳理產業政策、比對跨國法規、生成調研報告等。

這類任務對模型的檢索、思考、組織、判斷能力要求極高,幾乎是對 Agent 體系的全方位考驗。

話不多說,我們直接開測。

比如說我想讓它分析下2025年上半年黃金價格波動與美聯儲政策走向的關聯性。


它沒有立刻開始寫,而是反問了我一些問題,從研究邏輯本身出發,主動確認這個任務到底該怎么做才不空轉。

這種主動澄清機制,是過去在 Deep Research(左圖展示為:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右圖展示為MiniMax Agent)那種一口氣跑完所有流程后才看結果的虛擬機結構,更接近一個“你提一個話題,它開始一步步推”的助研模型。



Kimi比GPT更貼心增添了“Include everything”按鈕,不是單純放開信息源,而是直接把它切換到一種更傾向生成完整結構報告的工作狀態。


經過大概十幾分鐘的等待,它一共生成了兩種版本。

一種是我們熟悉的文字版研究報告,段落結構清晰,語氣沉穩,整體邏輯偏向內容層次 + 政策推導;另一種則是自動渲染的 HTML 格式報告,已經配好封面、標題、摘要、分節說明,標注出“核心發現”“關鍵風險”“歷史規律”這些結構化小標簽。

網頁稿鏈接在這,有興趣的朋友們可以打開看一看:

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108


內容還是很豐富的。

對經常要做對內材料和對外匯報的人來說,這種“寫+排+渲”一體的體驗,確實提高了交付效率。

你可以把它當成是Word+Notion+研究助理的混合體,不僅能輸出內容,還知道怎么讓內容看起來像一份真的報告。

然后我們也測了測生成PPT的能力。給它的任務是這樣的:

梳理一下 Stable Diffusion 從最初發布到最新版本的演進路線,列出各階段關鍵改進與社區貢獻節點,并作出PPT

看起來是一個非常結構化的問題,理論上應該正對 Researcher 的下懷。但實際操作過程中,我們也發現了一些限制。

1. 當前版本仍未支持多任務并行(當然,這可能只是內測階段的限制,正式版是否優化還有待觀察。)


2. 并不能生成傳統PPT,只能是 HTML 格式報告。


我們還是把report鏈接放在這里:

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108


不過也不能說它表現不好。作為一個學術型Agent,它在報告里自動加上了參考文獻鏈接,并用下劃線標注出處。可以完成一整套可交付內容。

而這,恰恰就是很多 AI 工具還停留在段落生成時無法做到的部分。

但當我們把這個任務交給 MiniMax Agent 時,體驗就完全不同了:

它不僅生成了 PPT,還一并打包了 PDF 報告、Markdown 研究文檔、圖表文件、項目任務表(todo.md)和用于可視化的 Python 腳本。

你可以下載 .pptx 源文件,二次修改內容和格式。也能查看 .md 的版本記錄、調圖的 .py 腳本,每一階段的中間產物全都可查。


從產出形式來看,它給你的是一整個PPT 制作系統,而不是一份靜態報告。

02

Kimi-Researcher和

MiniMax Agent,哪個更適合你

從執行力上來說,兩者都已經遠超傳統意義上的聊天機器人——你不用再一句一句提示,它們可以自己補全問題、拆解任務,甚至按你沒說出口的邏輯推下去。但使用下來,兩者的Agent 感其實來自不同的方向。

Kimi-Researcher 是任務導向的,它的邏輯很清楚:你給我一個研究型問題,我就像一個訓練過的助理那樣,問你三件事、查五份資料、最后給你一份成稿。

但 MiniMax 不太一樣。

它更像一個運行在虛擬機里的多工系統——你可以把它理解成你裝了一個干活的人,但這個人是你組裝出來的。他自己并不主張“要做研究”還是“要做運營”,而是你怎么設計,他就按你的指令一步步走。有時候你會覺得,它像是個開著調試模式的智能體,你能看到它每一步調用了什么插件、在哪個頁面抓了數據、用了哪個文檔里的知識。這種透明度很高的體驗,本質上更像是你操控一個流程機器人,而不是和一個人打交道。

如果說 Kimi 是把一個智能體藏在了模型背后,讓你感受到結果;那 MiniMax 更像是把智能體攤開在你眼前,讓你參與構建過程。兩者誰更強,不一定,但它們帶來的使用心智是完全不一樣的。

還有一個重要差別,是默認角色設定

Kimi 很明顯是自帶性格的——不夸張地說,它的Researcher標簽決定了它的行為方式,比如它更關注嚴謹表達、更傾向于做出規范排版、更容易使用資料比對視角進行總結。

而 MiniMax 給你的更多是空角色模板——你自己來寫 prompt,自己搭建鏈路,它才啟動真正的 Agent 能力。

我不是說哪個更好,我只是說它們在實現Agent這件事上,走的是完全不同的路徑。

在我們深度體驗兩者后,給出用戶一句話結論:如果你更在意“我提個需求就能直接拿到結果”,Kimi 會是更順手的選擇;但如果你希望掌控整個任務的執行流程、甚至自己定義智能體的邏輯結構,那 MiniMax 可能更適合你。

03

Kimi 做結果,MiniMax 做過程

說到底,Kimi 和 MiniMax 的這次同步出招,看起來像是在做 Agent,其實是在做一次底層策略切換。

Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設計這些 Developer 套路,它不是在鼓勵你搭建 Agent,而是干脆告訴你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究員的方式回應你。它把智能體的控制權從用戶界面撤回到了模型內部,交給了系統自動調度。

這一點是很多人沒意識到的。

過去我們理解的智能體,是我來設計、我來組合,但 Kimi 的思路是,你不需要設計,你只要告訴我你要什么結果,我來決定應該找誰干活、用什么方法、怎么安排流程。

它把整個 Agent 系統做成了一個黑箱,你丟任務進去,它自己完成任務拆解、插件調用、資料組織和內容生成。就像你發了封工作郵件,過一陣就能收到一份干凈利落的文檔回復。

很多人還在找插件入口,Kimi 已經在去插件化。

這兩種產品方向的不同,其實也能看出背后公司在策略上的側重點。Kimi 一直強調“長文本”能力和“系統性表達”,在 Researcher 這個產品上被推到極致,它更注重交付內容的完整性和邏輯性。

Kimi不是做開發者平臺,它要做的是“懂結構、能調度”的模型本體。這也解釋了為什么它一上來就定位在最復雜的研究類任務,因為這種任務能最大程度激活它預設的 Agent 內部機制:澄清問題、檢索并行、結構統籌、表達生成。這不是讓你看到它能干什么,而是逼你意識到,你其實可以不再親自干。

這點對用戶心智的沖擊,其實比 MiniMax 更強。

MiniMax 反而是最像 Agent的那一個。你真的可以看到它調用了哪些函數,爬了哪些網頁,引用了哪段語料,它給你一個完整的操作軌道,你像是在 Debug 一個機器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當成 Agent 的 IDE ——你是工程師,它是執行層。

但這個過程中,大多數用戶其實是有門檻的。

你需要理解:插件怎么綁定、變量怎么配置、路徑怎么切換、長文本怎么緩存……你得像在搭一個流程工廠。而 Kimi 則直接告訴你:“你什么都不用管,只要告訴我要結果。”

這個差別說到底,是兩家公司對智能體未來形態的不同下注。

MiniMax 賭的是:AI 應該成為一個流程平臺,你來決定它長成什么樣。

Kimi 賭的是:AI 應該直接成為一個能干事的角色,讓你不再需要流程本身。

這兩條路背后的預設完全不同。一個相信每個用戶都該擁有自己的Agent,一個相信模型應該成為能自動執行復雜任務的交付體。

Kimi 是在重新定義什么是工具,MiniMax 是在放大工具能到多深。

這場Agent戰役其實不是從用戶開始的,而是從怎么分配任務這件事開始的。而這,恰恰是大模型能力真正能走入現實的起點。

你以為你在選一個Agent工具,其實你在決定的是:你愿不愿意把解決問題的方式,也一并交給它。


歡迎在評論區留言~
如需開白請加小編微信:dongfangmark

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
蘋果官網突然上架:4月5日,新機打折開售!

蘋果官網突然上架:4月5日,新機打折開售!

科技堡壘
2026-04-05 12:16:41
抓緊將“鼓勵生育”確立為基本國策,對公職人員帶頭生育列入考核

抓緊將“鼓勵生育”確立為基本國策,對公職人員帶頭生育列入考核

星空區塊鏈
2026-04-06 19:57:31
1955 年饒漱石遭開除黨籍,歷多年關押服刑,晚年于農場度余生

1955 年饒漱石遭開除黨籍,歷多年關押服刑,晚年于農場度余生

嘮叨說歷史
2026-03-24 11:17:11
錢再多有什么用,64歲郎平如今的現狀,給所有運動員們提了個醒

錢再多有什么用,64歲郎平如今的現狀,給所有運動員們提了個醒

削桐作琴
2025-12-10 16:53:18
伊朗警告美國或將封鎖曼德海峽釋放出哪些信號 專家解讀

伊朗警告美國或將封鎖曼德海峽釋放出哪些信號 專家解讀

北青網-北京青年報
2026-04-06 18:46:13
曹操墓前擺滿布洛芬,高陵遺址博物館:清明游客眾多,每天有新的人來送,會擺放整齊不會隨意清理

曹操墓前擺滿布洛芬,高陵遺址博物館:清明游客眾多,每天有新的人來送,會擺放整齊不會隨意清理

極目新聞
2026-04-05 18:09:27
伊朗重申:繼續封鎖霍爾木茲海峽

伊朗重申:繼續封鎖霍爾木茲海峽

每日經濟新聞
2026-04-06 09:28:36
慈溪撤市設區的概率又提升了!這次的證據更硬核且三大同城紅利已兌現

慈溪撤市設區的概率又提升了!這次的證據更硬核且三大同城紅利已兌現

小蜜情感說
2026-04-06 18:39:32
清明回老家讓我發現:很多農村人越過越苦,大多是把錢花錯了地方

清明回老家讓我發現:很多農村人越過越苦,大多是把錢花錯了地方

小馬達情感故事
2026-04-05 18:45:03
毛主席聽到周總理訃告后問“逝世是什么意思”,孟錦云說出真相后,他沉默了

毛主席聽到周總理訃告后問“逝世是什么意思”,孟錦云說出真相后,他沉默了

史海孤雁
2026-03-11 23:33:06
WTI原油期貨漲幅擴大至3%,報114.964美元/桶

WTI原油期貨漲幅擴大至3%,報114.964美元/桶

每日經濟新聞
2026-04-06 06:20:05
曝字母哥被交易幾成定局!今夏聽取各隊報價:四大方案誰更誘人?

曝字母哥被交易幾成定局!今夏聽取各隊報價:四大方案誰更誘人?

羅說NBA
2026-04-05 22:14:37
美航天局局長稱外星人存在幾率“相當高”:搞清楚是否存在外星生命的問題,是美國國家航空航天局多項工作的“核心”

美航天局局長稱外星人存在幾率“相當高”:搞清楚是否存在外星生命的問題,是美國國家航空航天局多項工作的“核心”

大風新聞
2026-04-06 11:57:15
本周,“高中簽率”新股來了

本周,“高中簽率”新股來了

新浪財經
2026-04-06 18:47:07
孫穎莎:新的挑戰已在路上,下個賽場見

孫穎莎:新的挑戰已在路上,下個賽場見

北青網-北京青年報
2026-04-06 19:54:11
獨家供應商談張雪:當年他獨自造車在QQ上賣,先收錢后制造,奪冠比我想象的更早

獨家供應商談張雪:當年他獨自造車在QQ上賣,先收錢后制造,奪冠比我想象的更早

極目新聞
2026-04-04 10:39:03
第二個惡魔醫生被抓,鄭大一附院王福建為94名患者植入不需要器械

第二個惡魔醫生被抓,鄭大一附院王福建為94名患者植入不需要器械

大魚簡科
2026-02-18 22:03:00
1985年王景清探監江青,江青淡淡地說了句:李銀橋夫婦辦了件好事

1985年王景清探監江青,江青淡淡地說了句:李銀橋夫婦辦了件好事

鑒史錄
2026-04-02 01:50:03
約3億人背負著房貸,平均每戶欠銀行達140萬。

約3億人背負著房貸,平均每戶欠銀行達140萬。

流蘇晚晴
2026-04-04 19:39:51
馬筱梅稱產子后離不開臺北,復制了上一段婚姻,汪小菲又要頭疼了

馬筱梅稱產子后離不開臺北,復制了上一段婚姻,汪小菲又要頭疼了

無處遁形
2026-04-06 17:24:36
2026-04-06 21:55:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
258文章數 237關注度
往期回顧 全部

科技要聞

折疊屏iPhone要來了,富士康已在試產!

頭條要聞

特朗普咆哮式發帖威脅伊朗 美政界人士:他像精神錯亂

頭條要聞

特朗普咆哮式發帖威脅伊朗 美政界人士:他像精神錯亂

體育要聞

球員系列賽大滿貫!趙心童10-3世界第一 加冕賽季第4冠

娛樂要聞

唐嫣羅晉新加坡遛娃,6歲女兒身高搶鏡

財經要聞

史詩級暴跌"一周年" A股接下來如何走?

汽車要聞

阿維塔06T快上市了 旅行車還能這么玩?

態度原創

親子
旅游
本地
公開課
軍事航空

親子要聞

中泰小萌娃的快樂日常,簡單又治愈~

旅游要聞

別人放假,四川“帶娃”:春假清明接力,這波“天降流量”接住了嗎?

本地新聞

跟著歌聲游安徽,聽古村回響

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:在C-130運輸機殘骸中發現一具美軍士兵遺體

無障礙瀏覽 進入關懷版