網易首頁 > 網易號 > 正文申請入駐

MiniMax Agent 開年更新，好的 AI 產品，需要讓工具來適應人了

2026-01-21 17:43:52　來源: FounderPark

北京舉報

分享至

2026 年第一個月在科技圈刷屏的話題，是 Claude Cowork。

這是一個跑在本地的 AI Agent，一個面向大眾版的 Claude Code，能幫你點鼠標、幫你整理文件、幫你完成各種操作。

緊接著，開源社區迅速跟進，各種「開源 Cowork」或「Local First」產品接踵而至，或許是感受到了外部的競爭壓力，Anthropic 隨后將 100 美元 Max 套餐獨享的 Cowork 功能下調至 20 美元的 Pro 檔。

MiniMax 也在這個節點升級了旗下的 MiniMax Agent，推出了桌面端，提供本地文件處理功能、Browser Use 功能等等，用戶只需要一句話，即可快速完成基于本地的任務。同時網頁端新增專家（Expert）功能，可以將常用配置保存為可復用模板——指令、模型偏好、Agent 行為，一次配置，反復使用。

「桌面 Agent」突然火了起來，行業內已經似乎突然形成了某種清晰的共識。

當 AI 不再只存在于網頁對話框和云端環境里，而是進入你的真實工作環境，這件事究竟改變了什么？

答案很簡單：上下文擴容。

以前跟 AI 聊天，它的視野只有對話框里的幾行字，以及你上傳的附件。但現在不同了，你的硬盤、你的瀏覽器、你的文件目錄、你的屏幕畫面，都成了它的視野范圍。

與此同時，AI 開始從「咨詢顧問」轉向「執行者」。它不再只是給建議、提方案，而是可以真正動手：遍歷文件夾、調用本地資源、拆解任務并把流程跑完。

也正是在這個意義上，我們開始認真看待 MiniMax Agent Desktop。或許，桌面 Agent 的批量出現和流行，代表著 Agent 正在從概念，面向更大眾的群體，進入可以被日常使用、被實際交付的階段。

MiniMax Agent Desktop 免費體驗，還剩一天：https://agent.minimaxi.com/

??關注 Founder Park，最及時最干貨的創業分享

超 19000 人的「AI 產品市集」社群！不錯過每一款有價值的 AI 應用。

邀請從業者、開發人員和創業者，飛書掃碼加群：

進群后，你有機會得到：

最新、最值得關注的 AI 新品資訊；
不定期贈送熱門新品的邀請碼、會員碼；
最精準的AI產品曝光渠道

01從今天起，

不用再為整理文件困擾了

先從一件普通的小事開始使用 MiniMax Agent Desktop——整理文件夾，發票和整理桌面有些簡單，我們換一種方式。

我有一個堆了很多年的電子書文件夾，里面躺著 400 多本電子書。所謂「買書如病倒，讀書如抽絲」，松鼠癥患者都是這樣。文件名五花八門，有的是 ISBN，有的是作者名加書名，有的干脆是不明意義的編號「127766.The.epub」。

我給 MiniMax Agent Desktop 的任務很簡單：

按主題整理這個文件夾，規范書名；
不確定的地方可以自行檢索；
最后給我一份 Excel 表格。

Agent 沒有立刻動手，而是先請求了訪問權限。需要我明確選中目標文件夾，并確認它可以讀取和修改內容。

Minimax 請求編輯權限

這一步很重要，它明確了責任邊界，讓我心里踏實了很多。

確認之后，它也沒有馬上改文件名，而是先給我了一份整理規劃：會有哪些分類，如何判斷主題，模糊情況怎么處理。

MiniMax 規劃整理計劃

接下來，它才進入執行階段。左邊是對話窗口，右邊是命令行操作。明確的書直接處理；無法從文件名判斷內容的書，它會上網檢索，然后再歸類。

比如看到「傳奇中的大唐」這個文件名，它會去豆瓣查證，確認這是劉勃的歷史隨筆集，歸入「中國歷史」。

MiniMax Agent Desktop 的工作窗口：左邊是對話窗口，右邊是命令行操作界面

最終結果是兩個東西：一個被重新命名、分好類的文件夾；以及一份 Excel 表格，列清楚了文件路徑、規范化書名和主題。

老實說，當看著文件夾里的文件名在瞬間自動刷新、歸位，這種視覺沖擊力遠比生成一段文字要來得猛烈。那個飄在云端的 AI，第一次真正把手伸進了我的硬盤，完成了對現實世界的干涉。

整理前（左）vs 整理后（右）

值得一提的是，MiniMax 還找出了重復下載的書籍。

我追問了一句：你是怎么判斷重復的？

它的回答是：目前主要基于標題相似度。需要的話我也可以用哈希值再校驗一遍。

我當時的感覺仿佛是在玩一個開放世界的游戲——解決問題的路徑不止一種，你可以反復嘗試、擴展能力的邊界，甚至解鎖隱藏內容。

02可復用的 SOP，

讓 70 分的通才變成 95 分的專家

網頁端增加的專家功能值得單獨介紹下，簡單來說，它可以把一個人的方法論封裝成一個可以反復調用的執行體，在我的理解中，這其實算是 Claude Skill 的普適版，門檻更低，更好操作，但能力沒有打折。

MiniMax 封裝了一些專家 Agent，同時用戶也可以自己創建專家并發布到社區

這個特性觸及到了一個非常有價值的問題：經驗到底能不能被復用？

我選擇了一個極具挑戰性的任務：翻譯加西亞·馬爾克斯的《百年孤獨》開篇。

之所以選《百年孤獨》，是因為這段文字集合了時態穿越、魔幻現實主義的基調以及復雜的長句結構。范曄的譯本已經是許多人的心中標準，許多人也許沒看過原著，但是仍然可以輕松背誦那句著名的開頭：

多年以后，面對行刑隊，奧雷里亞諾·布恩迪亞上校將會回想起父親帶他去見識冰塊的那個遙遠的下午。

我先用常規的 Prompt 詞調試了一個「翻譯助手」，并將范曄的譯本作為對照組，試圖看看 MiniMax 能達到什么水準。

用戶可以通過自然語言對話創建專家，也能把行業經驗和 SOP 整合進去

MiniMax 的直出譯文在準確性上幾乎無可挑剔。它完美解析了原文中關于磁鐵吸鐵鍋、釘子掙扎的復雜邏輯鏈條，沒有出現任何事實性錯誤。

這大概是一個 75-80 分的水平，優于裸跑、沒優化過的通用大模型 70 分的水準。剩下的那 20 分差距，體現在那些微妙的「顆粒度」上。

MiniMax 的翻譯風格偏向直譯、準確，但沒有文學性

例如，形容磁鐵的神奇力量時，范曄用了「魔鐵」二字，古樸且帶有煉金術的神秘感；而 MiniMax 譯作「魔法鐵塊」，雖然意思對了，但少了一分文學的張力。

在描寫吉普賽人帶來的新發明時，范曄用了「牲口」來指代家畜，貼合農村的語境；MiniMax 則選用了「畜生」，雖然詞義相通，但在中文語境下，這個詞通常帶有罵人的感情色彩，稍顯偏差。

這可能就是單純靠 Prompt 調優的極限。我們確實能通過 Prompt 快速讓 AI 做到邏輯正確、語句通順。但想再往上走，達到 90-95 分的專家水準，光靠幾句提示詞是做不到的，因為它缺乏特定的「隱性知識」。

于是，我重新配置了 Expert Agent，寫入了一套詳細的 SOP：

定義人設：你不是翻譯機器，你是一位深諳拉美文學的中文小說家。
建立約束：禁止使用現代口語，優先使用古樸詞匯
注入知識庫：我上傳了一份「魔幻現實主義詞匯表」和「馬爾克斯句式風格指南」

注入 SOP 之后，翻譯結果呈現出了一種古樸的風格化特征，明顯要比上一版本更好讀，但有時會用力過猛。

這一次，MiniMax 呈現出了一種文學特質，要比上一版本好讀得多。例如范曄的這一句：

湍急的河水清澈見底，河床里卵石潔白光滑宛如史前巨蛋。

MiniMax 處理成了：

河床上鋪著光滑雪白的巨石，大如史前之卵。

「大如史前之卵」明顯好于上一版本「鵝卵石」；但「光滑雪白」不如范曄的「潔白光滑」讀起來順口。

但它有時會顯得用力過猛，把吉卜賽人和馬孔多描繪得有點像中國古代傳奇小說（比如「方生方始」、「提及之際須以手指勾勒」），稍微偏離了拉丁美洲的魔幻現實主義基調。

MiniMax 甚至整理了翻譯札記

坦白說，即便加了 SOP，AI 依然無法徹底超越范曄的版本。范曄譯本中那種「史前巨蛋」的精妙比喻、「魔鐵」的煉金術色彩，依然是人類靈性的高地。

但令我感到震撼的是，僅僅在我注入那套 SOP 之后，MiniMax 就達成了肉眼可見的進步。這才是 Expert Agents 真正性感的地方：它讓「經驗」變成了一種可復用的能力。

同理，如果你是一位資深行業專家，你可以將自己多年的關鍵詞挖掘邏輯、競品分析框架、SOP上傳到知識庫。當你把這個 Agent 分享給 AI 實習生時，他就不再是面對一個只會說車轱轆話的通用 AI，而是在使用你的「數字分身」。這種能力的釋放，意味著我們只需要做一次「封包」動作，就能讓 AI 站在我們的肩膀上工作。

03Agent 的世界難題：

「最后一公里」

第三個實驗，我刻意選了一個更容易失敗的方向——我想驗證，「一人公司」到底是不是一句空話。

于是我設計了一條內容流水線：

先調研小紅書科技類目的對標賬號，分析他們的內容策略、爆款特征；
然后基于調研結果，批量生成選題和內容；
最后發布到平臺上。

第一個任務「深度調研」，MiniMax 調用 Web 搜索工具，檢索最近一周的科技要聞、小紅書科技博主的對標賬號信息。搜索完成后，它自動提取關鍵信息，生成了一份詳細的分析報告，包含賬號定位、粉絲量級、內容類型、爆款特點等維度。

MiniMax 生成的深度報告及圖表信息

第二個任務「生成內容」。基于調研結果，MiniMax 批量生成了多篇科技類選題，包括封面圖、文案、標簽建議。

到目前為止，一切都非常絲滑，AI 展現出了驚人的生產力閉環。

說實話，看著它自動打開瀏覽器，熟練地找到發布入口，試圖填入標題和正文，這種從「調研」到「執行」全鏈路跑通的觀感，簡直像是在看科幻片。這是我第一次真正意義上目睹 AI 試圖獨自走完業務的全流程。

但是，當 AI 真正介入到復雜的人類世界時，就會發現到處存在卡點。登錄賬號、圖片上傳、頁面校驗，這些對人來說是肌肉記憶的動作，對 Agent 卻是「高摩擦操作」。GUI 本身就是為人類設計的，讓 AI 在這種界面里高效操作，本身就違反了 AI 的「天性」；再加上平臺嚴格的風控政策（比如驗證碼、設備檢測），難度就更大了。

MiniMax 生成的小紅書帖子，包含小紅書標志性的 Emoji 文風，Tag以及增加互動率的引導

整個過程中，MiniMax 提示我需要人工介入的有兩個環節，一是登錄小紅書賬號，二是上傳 MiniMax 生成的封面圖片。

Minimax操作小紅書后臺

當然，這不妨礙它完成前面 90% 的工作。調研、生成、素材準備，這些原本需要花費數小時甚至數天的任務，它在幾分鐘內就完成了。

最后那一步的人工介入，與其說是 Agent 的不足，不如說是一個合理的邊界劃定：涉及賬號安全、平臺規則的操作，還是需要人類的最終確認。

這可能才是人類和 AI 協作的最理想畫面：不要期待 Agent 替你完成一切，而是要理解它的能力邊界，然后調整自己的工作流程。讓 AI 擅長的事情，讓人做人擅長的事情——這可能是一種更健康、更高效的協作模式。

在 MiniMax 操作小紅書后臺的過程中，用戶可以隨時暫停、人工介入。

04一切都關乎「上下文」

跳出具體的功能評測，MiniMax Agent Desktop 的出現，其實引發了我對「資產」兩個字的重新思考。

很多公司的核心資產是「經驗」和「SOP」。但傳統的 SOP 是寫在文檔里的死文字，新員工看了也不一定懂，懂了也不一定照做。

MiniMax 的 Expert Agents 提供了一種新的可能：你可以把個人和團隊的方法論「封裝」成可執行的程序。比如你的團隊有一套成熟的內容生產流程——調研、選題、寫作、排版、發布——你可以把這套流程固化下來，讓 Agent 按照同樣的標準執行。

這樣一來，SOP 不再是紙上的條文，而是可交接、可復用、可執行的數字資產。新人不需要從零開始學習，直接調用專家的「方法論」，就能交付質量穩定的成果。

然后是心態轉變。

以前我們用 AI 的感覺像開腦暴會。你說「幫我寫個文案」，它給你十個版本；你說「哪個更好」，它分析一通。整個過程是探索性的、發散式的，AI 是你的思考伙伴。

但用 Agent 的感覺完全不同，像帶新人。你想清楚了要干什么，然后給它下達任務，用「驗收標準」去溝通。它去執行，你來驗收。有問題就調整，沒問題就通過。

這種轉變意味著，你需要把自己的思維方式從「提問」轉向「管理」。不是問 AI「你覺得怎么辦」，而是告訴 AI「我要什么結果，你幫我辦」。

最后是邊界重構。

正如開頭所說，桌面 Agent 改變的是「上下文」。但這個詞背后隱藏著一個更本質的變化：過去是人去適應工具，現在是 Agent 主動進入人的環境。

過去三十年，我們一直在適應軟件。鼠標該怎么點、菜單在哪里、快捷鍵是什么——這些都是人要去學習、去記憶、去適應的。但 Agent 不一樣。它不需要你學習它的操作邏輯，而是它來理解你的工作環境、適應你的使用習慣。

這可能才是 MiniMax Agent Desktop 真正的意義：連接「本地資產」與「云端智能」的橋梁。你的知識、你的文件、你的工作成果都在本地；云端的 AI 能力通過 Agent 進入你的環境，為你所用。

有了更多的上下文，Agent 的能力真的可以不一樣。

05總結

三年前，我們還在為 AI 能寫出一首打油詩而驚嘆；今天，我們已經開始討論如何讓它接管我們的工作流。

Claude Cowork 的推出、MiniMax Agent Desktop 的這次更新，相比 Cloude Code 等 cli 工具，不只是 GUI 界面的更新，更像是一次對未來工作形態的預演。

它并不完美，在 GUI 操作上還有進化的空間，但指明了方向——AI 不應止步于聊天框，它必須深入到我們的硬盤、我們的瀏覽器、我們的具體業務場景中去。

這可能才是 2026 年真正改變的東西：不是人去適應分散的工具，而是 Agent 主動進入人的環境。

也是 Agent 產品真正走向更大眾市場的開始。

轉載原創文章請添加微信：founderparker

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.