2026 年第一個月在科技圈刷屏的話題,是 Claude Cowork。
這是一個跑在本地的 AI Agent,一個面向大眾版的 Claude Code,能幫你點鼠標、幫你整理文件、幫你完成各種操作。
緊接著,開源社區迅速跟進,各種「開源 Cowork」或「Local First」產品接踵而至,或許是感受到了外部的競爭壓力,Anthropic 隨后將 100 美元 Max 套餐獨享的 Cowork 功能下調至 20 美元的 Pro 檔。
MiniMax 也在這個節點升級了旗下的 MiniMax Agent,推出了桌面端,提供本地文件處理功能、Browser Use 功能等等,用戶只需要一句話,即可快速完成基于本地的任務。同時網頁端新增專家(Expert)功能,可以將常用配置保存為可復用模板——指令、模型偏好、Agent 行為,一次配置,反復使用。
「桌面 Agent」突然火了起來,行業內已經似乎突然形成了某種清晰的共識。
當 AI 不再只存在于網頁對話框和云端環境里,而是進入你的真實工作環境,這件事究竟改變了什么?
答案很簡單:上下文擴容。
以前跟 AI 聊天,它的視野只有對話框里的幾行字,以及你上傳的附件。但現在不同了,你的硬盤、你的瀏覽器、你的文件目錄、你的屏幕畫面,都成了它的視野范圍。
與此同時,AI 開始從「咨詢顧問」轉向「執行者」。它不再只是給建議、提方案,而是可以真正動手:遍歷文件夾、調用本地資源、拆解任務并把流程跑完。
也正是在這個意義上,我們開始認真看待 MiniMax Agent Desktop。或許,桌面 Agent 的批量出現和流行,代表著 Agent 正在從概念,面向更大眾的群體,進入可以被日常使用、被實際交付的階段。
MiniMax Agent Desktop 免費體驗,還剩一天:https://agent.minimaxi.com/
??關注 Founder Park,最及時最干貨的創業分享
超 19000 人的「AI 產品市集」社群!不錯過每一款有價值的 AI 應用。
邀請從業者、開發人員和創業者,飛書掃碼加群:
進群后,你有機會得到:
最新、最值得關注的 AI 新品資訊;
不定期贈送熱門新品的邀請碼、會員碼;
最精準的AI產品曝光渠道
01從今天起,
不用再為整理文件困擾了
先從一件普通的小事開始使用 MiniMax Agent Desktop——整理文件夾,發票和整理桌面有些簡單,我們換一種方式。
我有一個堆了很多年的電子書文件夾,里面躺著 400 多本電子書。所謂「買書如病倒,讀書如抽絲」,松鼠癥患者都是這樣。文件名五花八門,有的是 ISBN,有的是作者名加書名,有的干脆是不明意義的編號「127766.The.epub」。
我給 MiniMax Agent Desktop 的任務很簡單:
按主題整理這個文件夾,規范書名;
不確定的地方可以自行檢索;
最后給我一份 Excel 表格。
Agent 沒有立刻動手,而是先請求了訪問權限。需要我明確選中目標文件夾,并確認它可以讀取和修改內容。
![]()
Minimax 請求編輯權限
這一步很重要,它明確了責任邊界,讓我心里踏實了很多。
確認之后,它也沒有馬上改文件名,而是先給我了一份整理規劃:會有哪些分類,如何判斷主題,模糊情況怎么處理。
![]()
MiniMax 規劃整理計劃
接下來,它才進入執行階段。左邊是對話窗口,右邊是命令行操作。明確的書直接處理;無法從文件名判斷內容的書,它會上網檢索,然后再歸類。
比如看到「傳奇中的大唐」這個文件名,它會去豆瓣查證,確認這是劉勃的歷史隨筆集,歸入「中國歷史」。
![]()
MiniMax Agent Desktop 的工作窗口: 左邊是對話窗口,右邊是命令行操作界面
最終結果是兩個東西:一個被重新命名、分好類的文件夾;以及一份 Excel 表格,列清楚了文件路徑、規范化書名和主題。
老實說,當看著文件夾里的文件名在瞬間自動刷新、歸位,這種視覺沖擊力遠比生成一段文字要來得猛烈。那個飄在云端的 AI,第一次真正把手伸進了我的硬盤,完成了對現實世界的干涉。
![]()
整理前(左)vs 整理后(右)
值得一提的是,MiniMax 還找出了重復下載的書籍。
我追問了一句:你是怎么判斷重復的?
它的回答是:目前主要基于標題相似度。需要的話我也可以用哈希值再校驗一遍。
我當時的感覺仿佛是在玩一個開放世界的游戲——解決問題的路徑不止一種,你可以反復嘗試、擴展能力的邊界,甚至解鎖隱藏內容。
02可復用的 SOP,
讓 70 分的通才變成 95 分的專家
網頁端增加的專家功能值得單獨介紹下,簡單來說,它可以把一個人的方法論封裝成一個可以反復調用的執行體,在我的理解中,這其實算是 Claude Skill 的普適版,門檻更低,更好操作,但能力沒有打折。
![]()
MiniMax 封裝了一些專家 Agent,同時用戶也可以自己創建專家并發布到社區
這個特性觸及到了一個非常有價值的問題:經驗到底能不能被復用?
我選擇了一個極具挑戰性的任務:翻譯加西亞·馬爾克斯的《百年孤獨》開篇。
之所以選《百年孤獨》,是因為這段文字集合了時態穿越、魔幻現實主義的基調以及復雜的長句結構。范曄的譯本已經是許多人的心中標準,許多人也許沒看過原著,但是仍然可以輕松背誦那句著名的開頭:
多年以后,面對行刑隊,奧雷里亞諾·布恩迪亞上校將會回想起父親帶他去見識冰塊的那個遙遠的下午。
我先用常規的 Prompt 詞調試了一個「翻譯助手」,并將范曄的譯本作為對照組,試圖看看 MiniMax 能達到什么水準。
![]()
用戶可以通過自然語言對話創建專家,也能把行業經驗和 SOP 整合進去
MiniMax 的直出譯文在準確性上幾乎無可挑剔。它完美解析了原文中關于磁鐵吸鐵鍋、釘子掙扎的復雜邏輯鏈條,沒有出現任何事實性錯誤。
這大概是一個 75-80 分的水平,優于裸跑、沒優化過的通用大模型 70 分的水準。剩下的那 20 分差距,體現在那些微妙的「顆粒度」上。
![]()
MiniMax 的翻譯風格偏向直譯、準確,但沒有文學性
例如,形容磁鐵的神奇力量時,范曄用了「魔鐵」二字,古樸且帶有煉金術的神秘感;而 MiniMax 譯作「魔法鐵塊」,雖然意思對了,但少了一分文學的張力。
在描寫吉普賽人帶來的新發明時,范曄用了「牲口」來指代家畜,貼合農村的語境;MiniMax 則選用了「畜生」,雖然詞義相通,但在中文語境下,這個詞通常帶有罵人的感情色彩,稍顯偏差。
這可能就是單純靠 Prompt 調優的極限。我們確實能通過 Prompt 快速讓 AI 做到邏輯正確、語句通順。但想再往上走,達到 90-95 分的專家水準,光靠幾句提示詞是做不到的,因為它缺乏特定的「隱性知識」。
于是,我重新配置了 Expert Agent,寫入了一套詳細的 SOP:
定義人設:你不是翻譯機器,你是一位深諳拉美文學的中文小說家。
建立約束:禁止使用現代口語,優先使用古樸詞匯
注入知識庫:我上傳了一份「魔幻現實主義詞匯表」和「馬爾克斯句式風格指南」
![]()
注入 SOP 之后,翻譯結果呈現出了一種古樸的風格化特征,明顯要比上一版本更好讀,但有時會用力過猛。
這一次,MiniMax 呈現出了一種文學特質,要比上一版本好讀得多。例如范曄的這一句:
湍急的河水清澈見底,河床里卵石潔白光滑宛如史前巨蛋。
MiniMax 處理成了:
河床上鋪著光滑雪白的巨石,大如史前之卵。
「大如史前之卵」明顯好于上一版本「鵝卵石」;但「光滑雪白」不如范曄的「潔白光滑」讀起來順口。
但它有時會顯得用力過猛,把吉卜賽人和馬孔多描繪得有點像中國古代傳奇小說(比如「方生方始」、「提及之際須以手指勾勒」),稍微偏離了拉丁美洲的魔幻現實主義基調。
![]()
MiniMax 甚至整理了翻譯札記
坦白說,即便加了 SOP,AI 依然無法徹底超越范曄的版本。范曄譯本中那種「史前巨蛋」的精妙比喻、「魔鐵」的煉金術色彩,依然是人類靈性的高地。
但令我感到震撼的是,僅僅在我注入那套 SOP 之后,MiniMax 就達成了肉眼可見的進步。這才是 Expert Agents 真正性感的地方:它讓「經驗」變成了一種可復用的能力。
同理,如果你是一位資深行業專家,你可以將自己多年的關鍵詞挖掘邏輯、競品分析框架、SOP上傳到知識庫。當你把這個 Agent 分享給 AI 實習生時,他就不再是面對一個只會說車轱轆話的通用 AI,而是在使用你的「數字分身」。這種能力的釋放,意味著我們只需要做一次「封包」動作,就能讓 AI 站在我們的肩膀上工作。
03Agent 的世界難題:
「最后一公里」
第三個實驗,我刻意選了一個更容易失敗的方向——我想驗證,「一人公司」到底是不是一句空話。
于是我設計了一條內容流水線:
先調研小紅書科技類目的對標賬號,分析他們的內容策略、爆款特征;
然后基于調研結果,批量生成選題和內容;
最后發布到平臺上。
第一個任務「深度調研」,MiniMax 調用 Web 搜索工具,檢索最近一周的科技要聞、小紅書科技博主的對標賬號信息。搜索完成后,它自動提取關鍵信息,生成了一份詳細的分析報告,包含賬號定位、粉絲量級、內容類型、爆款特點等維度。
![]()
MiniMax 生成的深度報告及圖表信息
第二個任務「生成內容」。基于調研結果,MiniMax 批量生成了多篇科技類選題,包括封面圖、文案、標簽建議。
到目前為止,一切都非常絲滑,AI 展現出了驚人的生產力閉環。
說實話,看著它自動打開瀏覽器,熟練地找到發布入口,試圖填入標題和正文,這種從「調研」到「執行」全鏈路跑通的觀感,簡直像是在看科幻片。這是我第一次真正意義上目睹 AI 試圖獨自走完業務的全流程。
但是,當 AI 真正介入到復雜的人類世界時,就會發現到處存在卡點。登錄賬號、圖片上傳、頁面校驗,這些對人來說是肌肉記憶的動作,對 Agent 卻是「高摩擦操作」。GUI 本身就是為人類設計的,讓 AI 在這種界面里高效操作,本身就違反了 AI 的「天性」;再加上平臺嚴格的風控政策(比如驗證碼、設備檢測),難度就更大了。
![]()
MiniMax 生成的小紅書帖子,包含小紅書標志性的 Emoji 文風,Tag以及增加互動率的引導
整個過程中,MiniMax 提示我需要人工介入的有兩個環節,一是登錄小紅書賬號,二是上傳 MiniMax 生成的封面圖片。
![]()
Minimax操作小紅書后臺
當然,這不妨礙它完成前面 90% 的工作。調研、生成、素材準備,這些原本需要花費數小時甚至數天的任務,它在幾分鐘內就完成了。
最后那一步的人工介入,與其說是 Agent 的不足,不如說是一個合理的邊界劃定:涉及賬號安全、平臺規則的操作,還是需要人類的最終確認。
這可能才是人類和 AI 協作的最理想畫面:不要期待 Agent 替你完成一切,而是要理解它的能力邊界,然后調整自己的工作流程。讓 AI 擅長的事情,讓人做人擅長的事情——這可能是一種更健康、更高效的協作模式。
![]()
在 MiniMax 操作小紅書后臺的過程中,用戶可以隨時暫停、人工介入。
04一切都關乎「上下文」
跳出具體的功能評測,MiniMax Agent Desktop 的出現,其實引發了我對「資產」兩個字的重新思考。
很多公司的核心資產是「經驗」和「SOP」。但傳統的 SOP 是寫在文檔里的死文字,新員工看了也不一定懂,懂了也不一定照做。
MiniMax 的 Expert Agents 提供了一種新的可能:你可以把個人和團隊的方法論「封裝」成可執行的程序。比如你的團隊有一套成熟的內容生產流程——調研、選題、寫作、排版、發布——你可以把這套流程固化下來,讓 Agent 按照同樣的標準執行。
這樣一來,SOP 不再是紙上的條文,而是可交接、可復用、可執行的數字資產。新人不需要從零開始學習,直接調用專家的「方法論」,就能交付質量穩定的成果。
然后是心態轉變。
以前我們用 AI 的感覺像開腦暴會。你說「幫我寫個文案」,它給你十個版本;你說「哪個更好」,它分析一通。整個過程是探索性的、發散式的,AI 是你的思考伙伴。
但用 Agent 的感覺完全不同,像帶新人。你想清楚了要干什么,然后給它下達任務,用「驗收標準」去溝通。它去執行,你來驗收。有問題就調整,沒問題就通過。
這種轉變意味著,你需要把自己的思維方式從「提問」轉向「管理」。不是問 AI「你覺得怎么辦」,而是告訴 AI「我要什么結果,你幫我辦」。
最后是邊界重構。
正如開頭所說,桌面 Agent 改變的是「上下文」。但這個詞背后隱藏著一個更本質的變化:過去是人去適應工具,現在是 Agent 主動進入人的環境。
過去三十年,我們一直在適應軟件。鼠標該怎么點、菜單在哪里、快捷鍵是什么——這些都是人要去學習、去記憶、去適應的。但 Agent 不一樣。它不需要你學習它的操作邏輯,而是它來理解你的工作環境、適應你的使用習慣。
這可能才是 MiniMax Agent Desktop 真正的意義:連接「本地資產」與「云端智能」的橋梁。你的知識、你的文件、你的工作成果都在本地;云端的 AI 能力通過 Agent 進入你的環境,為你所用。
有了更多的上下文,Agent 的能力真的可以不一樣。
05總結
三年前,我們還在為 AI 能寫出一首打油詩而驚嘆;今天,我們已經開始討論如何讓它接管我們的工作流。
Claude Cowork 的推出、MiniMax Agent Desktop 的這次更新,相比 Cloude Code 等 cli 工具,不只是 GUI 界面的更新,更像是一次對未來工作形態的預演。
它并不完美,在 GUI 操作上還有進化的空間,但指明了方向——AI 不應止步于聊天框,它必須深入到我們的硬盤、我們的瀏覽器、我們的具體業務場景中去。
這可能才是 2026 年真正改變的東西:不是人去適應分散的工具,而是 Agent 主動進入人的環境。
也是 Agent 產品真正走向更大眾市場的開始。
轉載原創文章請添加微信:founderparker
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.