大家好,我是沃垠AI的最肝員工冷逸。
整個AI圈,亂成一鍋粥了。
![]()
DeepSeek、GLM、MiniMax都相繼出貨,據(jù)說Doubao、Qwen也蠢蠢欲動。
前兩位,咱們之前聊過。今天,我們來看下MiniMax-M2.5。
官方介紹:https://minimaxi.com/news/minimax-m25
M2、M2.1和M2.5,他們三都是基于同一個Base模型訓練。這種策略,讓M2.5在性能飆升的同時,成本顯著降低。
而隔壁某模型,因為換了更大的新架構,剛上線就會有點慢,即使Pro都慢。
其實,現(xiàn)在算力挺卡國產模型的。硅基流動的好朋友@楊攀 在朋友圈直言:今年Token一定會漲價。
![]()
M2.5做到了性能媲美Claude Opus級別的同時,還把價格給打了下來:
每秒吐100token的情況下,M2.5連續(xù)工作1h只要1美金;
50 token/s,則只要0.3美金。
這么說大家可能沒什么概念,我們跟Claude和Gemini對比一下,你就明白了。
![]()
如果用Claude Opus 4.6或Gemini 3 Pro,成本基本得在后面加一個0。
現(xiàn)在很多Agent都非常吃Token。比如OpenClaw,我剛裝上那會兒,充了50塊錢才問到第3個問題,云廠商就發(fā)短信提醒我余額變負了……
Agent時代,供給是線性的,需求是指數(shù)的,成本真的太重要了。
M2.5之所以能大幅降本,關鍵在于它優(yōu)化了模型對復雜任務的拆解能力,并壓縮了思考過程中的token消耗,整體比M2.1快了37%。
整體性能,很猛,與Claude Opus 4.6、Gemini 3 Pro不相上下。
![]()
尤其是跟M2.1比,進步肉眼看見。
前段時間OpenClaw爆火,很多人就是接的M2.1,因為它的Agentic能力比較強。
如今M2.5既提升了性能,又控制了成本,非常適合拿來做Agent底模。
架構方面,M2.5從設計初就是一個原生Agent RL架構,在Agentic腳手架和工具調用上有很強的泛化能力。
![]()
所以,它天然適合“多步驟、長鏈路的復雜任務”,適合各種Agent任務。
然后,算法依然是沿用MiniMax年初提出的CISPO,從M1起就做到了“好、快、省”。
![]()
從我自己實測來看,M2.5的Coding能力很強,它能像架構師一樣思考和構建編程項目。
先來一個我常測的信息圖,主要考驗模型的前端設計能力。
![]()
整體合格,跟Gemini 3 Pro、K2.5、GLM-5沒什么明顯差距。
接下來,給M2.5來個Agentic任務,讓它調用搜索工具和Remotion Skills,總結MiniMax M2.5的官宣文章并自動制作一個視頻。
基于這篇文章: https://mp.weixin.qq.com/s/M4LBGM3Jcy0syWvQ_78ahw,用Remotion Skills幫我做一個視頻。
大概5分鐘左右,視頻就做好了。
![]()
接下來,我只需要輸入:npm run build,就能直接把視頻渲染出來。
npm run build這是最終的成品(BGM是我自己加的)。
類似Case,我用隔壁模型也跑過,那邊基本要20-30分鐘,M2.5只花了5分鐘。
之前用做了一個「沃垠AI抓挖機」手勢小游戲,當時是圣誕風格。這次讓M2.5把它改成新年風格,看看完成度如何。
![]()
完成得還不錯,1分鐘搞定,視覺風格、元素、配色都換得很到位,也能正常玩起來。
就是……我玩的時候才發(fā)現(xiàn),馬年還有3天就到了,而我還在加班……
最后,我把這個游戲部署到了MiniMax網(wǎng)頁端,所有人都可以玩,祝大家馬到功成。
![]()
體驗地址:https://65pjklp9ekup.space.minimaxi.com
總的來看,M2.5在Coding方面確實靠譜。無論是One shot、長任務還是代碼修改,它都能像架構師一樣思考,且生成速度大幅提升。
在過去這100天里,的進步有目共睹,MiniMax迅速從“追趕”進化到了“比肩”御三家(Claude、Gemini、GPT)。
![]()
編程這塊,M2.5算是追上來了,成為國內第二家做到Claude Opus水平的模型。
而且,它還開源,激活參數(shù)僅10B,所以能夠支持100 TPS的高吞吐量,速度是Claude Opus的3倍。
這應該是目前第一梯隊中參數(shù)最小的模型,很適合私有化部署。對企業(yè)來說,這個優(yōu)勢非常實際。
不過,坦誠地說,M2.5在"洗車"和"丁真"問題上都翻車了,邏輯推理方面仍有提升空間。
![]()
![]()
國產模型繼續(xù)加油!希望也能早日像Gemini 3 Pro那樣智力超群。
期待2026年~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.