![]()
![]()
文 | 林晚晚
2014年,百度研究院來了個實習(xí)生,中科院自動化所的博士,河南縣城出來的。他給自己算過一筆賬:畢業(yè)后最理想的去處是 IBM,寫 Java,年薪28萬。
2026年春節(jié),一款叫 OpenClaw 的 Agent 工具全球爆火,開發(fā)者搭龍蝦需要底層大模型撐著。有個模型又快又便宜,一周在 OpenRouter 上吞掉1.44萬億 Token,登頂全平臺第一。
這個模型叫 M2.5,公司叫 MiniMax。
上市兩個月,股價從165港元沖到1300港元,市值破3000億,而它還是一家年收入不到8000萬美元的公司。
做出 MiniMax 的人,就是十二年前那個實習(xí)生,閆俊杰。
提前一年多的賭注
2021年春節(jié),閆俊杰回河南老家過年,去看了外公。
外公跟他說,想寫一本回憶錄,記錄這80年的人生。但不會打字,也沒辦法把故事好好組織起來,說了幾次,就擱下了。
閆俊杰在 AI 行業(yè)做了十多年。那一刻他突然意識到,他做的這些東西,哪怕已經(jīng)在產(chǎn)業(yè)里落地,幫了多少企業(yè),但對一個想寫回憶錄的老人來說,一點用都沒有。
這個細節(jié)后來被反復(fù)引用,有點勵志故事的味道。但它確實解釋了一件事:他做 AI 的動機很樸素,讓普通人真的能用上。這股執(zhí)念,后來驅(qū)動了一系列反直覺的決策。
2021年底,他從商湯離職了。
時間點很關(guān)鍵。商湯當時正在準備港股上市,他是副總裁,研究院副院長,智慧城市事業(yè)群 CTO,走的時候是公司最值錢的時候之一。他沒等到上市,沒等到財富兌現(xiàn),就出來了。
ChatGPT 是2022年11月才發(fā)布的。
MiniMax,2021年12月成立。
這個時間差,是后來一切的基礎(chǔ)。閆俊杰后來自己說,要不是做得早,在后來「明星研究員和大廠 AI 背景更受歡迎」的融資環(huán)境里,MiniMax 根本打不過別人。
他父母都是普通人。高中在縣城讀,考上東南大學(xué)數(shù)學(xué)系,后來中科院自動化所讀博,清華博士后,再進商湯,一步步走出來,沒有任何海外背景,也沒有什么顯赫的人脈起點。
在百度實習(xí)那陣子,他和地平線的余凱有過交集。余凱后來說,學(xué)術(shù)能力可以訓(xùn)練,但能把 AI 技術(shù)工程化落地的人,鳳毛麟角。閆俊杰是其中之一。
![]()
進商湯之后,他七年從實習(xí)生做到副總裁。2018年,在人手不夠的情況下,他帶隊做出了一套「All for One」模型算法,在競標里反超曠視和依圖,拿到行業(yè)第一。有人評價他「看論文速度奇快,不管陳詞濫調(diào),只看精華要義」。這種效率,后來成了 MiniMax 的公司文化。
他給公司取名 MiniMax,來自博弈論里馮·諾依曼的極小化極大算法。
他的解釋是,做決策要先防住最壞的風(fēng)險,再選相對最優(yōu)解。
一張奇特的股東表
2021年12月,MiniMax 完成天使輪,3100萬美元,投前估值1.7億美元。進來的有米哈游、IDG、高瓴、云啟。
米哈游那筆錢有點特別。閆俊杰和米哈游董事長劉偉私交不錯,天使輪就進來了,現(xiàn)在劉偉還在 MiniMax 的董事會里掛著非執(zhí)行董事。
米哈游本身就是 MiniMax 的客戶,游戲里的 NPC 對話、劇情生成,都在用他們的模型。
天使輪之后,故事遭遇了一個小插曲。
2023年3月,硅谷銀行宣布破產(chǎn)。MiniMax 當時所有資金都在那家銀行。這是創(chuàng)業(yè)初期最險的一次,錢沒了,融資環(huán)境還一片混亂。但他們撐過去了,兩個月后拿到 A 輪2.57億美元,估值11.57億美元。
接下來的名單越來越夸張。阿里進來了,騰訊進來了,紅杉跟了進去。到上市前,7輪融資,累計近15億美元,估值42億美元。IPO 后阿里持股12.52%,是最大外部股東。
閆俊杰早期融資有一個習(xí)慣:只和投資機構(gòu)的最高位談。他見了紅杉的沈南鵬,見了高瓴的張磊。
但這張股東表上還有一個人值得單獨講:贠燁祎。
1994年生,約翰·霍普金斯大學(xué)電子工程本科,輔修經(jīng)濟學(xué)和數(shù)學(xué)。2017年本科一畢業(yè)就進商湯,干的是融資與戰(zhàn)略投資,一年后升任 CEO 徐立的行政助理兼戰(zhàn)略部總監(jiān)。她深度參與了商湯從早期到港股上市的整個過程。
2021年,她和閆俊杰一起出來創(chuàng)業(yè)。
![]()
有投資人評價她「干練、有氣場、執(zhí)行力強,有種超出其年齡的成熟」。她和閆俊杰的分工很清晰:一個定義技術(shù)愿景,一個把愿景變成錢和資源。閆俊杰能鉆進技術(shù)里,頭發(fā)都剃光了也無所謂,但市場、資本、全球化,是贠燁祎的戰(zhàn)場。
上市敲鐘那天,兩個人站在同一個臺子上。贠燁祎31歲,身價超過40億港元。
385人和1% 的錢
MiniMax 上市時,全公司385人,平均年齡29歲。
公司從成立到2025年9月,累計花費約5億美元。OpenAI 同期花了400億到550億美元。
這個對比有點荒謬。用不到對手1% 的錢,做出了全模態(tài)全球領(lǐng)先的公司。省錢只是結(jié)果。真正的原因是他們把 AI 用到了極致。
公司80% 的代碼由 AI 完成,內(nèi)部管 AI 叫「實習(xí)生」,這些實習(xí)生權(quán)限高到可以直接訪問代碼庫、改線上環(huán)境,飛書里和它聊幾句,review 完直接上線。
這種效率讓 MiniMax 的人均產(chǎn)出高到不正常。
產(chǎn)品層面,他們從一開始就走全模態(tài)路線:語言、視頻、語音、音樂,四個方向同時壓。別人都在學(xué) ChatGPT 做對話,閆俊杰押的是多模態(tài)融合。他的判斷是,多模態(tài)是持續(xù)提升智能的基本前提,不做全模態(tài),下一代模型就沒有機會。
2023年夏天,他做了一個更激進的決定。
把80% 的算力和研發(fā)資源,全部壓到 MoE(混合專家系統(tǒng))上。
那個時候,國內(nèi)主流還在迭代稠密模型,MoE 被認為是「前沿但不成熟」的技術(shù)。閆俊杰的邏輯很簡單:如果要服務(wù)千萬級、億級用戶,生成 token 的成本和延時,用稠密模型根本撐不住。不做 MoE,規(guī)模上不去,一切都是白搭。
2024年初,MiniMax 發(fā)布了國內(nèi)首個 MoE 大模型。
產(chǎn)品上,他們也沒有去卷國內(nèi)市場。C 端做了星野和 Talkie,一個在國內(nèi),一個在海外,做 AI 陪伴;海螺 AI 做視頻生成,2024年下半年連續(xù)半年全球視頻生成應(yīng)用月活第一。
現(xiàn)在的數(shù)字:2.36億用戶,覆蓋200個國家和地區(qū),海外收入占73%。B 端21.4萬企業(yè)客戶和開發(fā)者,Google Vertex AI、微軟 Azure、AWS 都已經(jīng)部署了 MiniMax 的模型,Notion 首個開源模型選擇,也是 MiniMax。
2月的 ARR 突破了1.5億美元,M2系列單日 Token 消耗量是去年12月的6倍,其中編程方向增長超10倍。
這才是市場愿意給200倍市銷率的原因。
但有一組數(shù)字要拆開看。
年報里,C 端毛利率4.7%,B 端毛利率69.4%。公司67% 的收入來自 C 端,但 C 端幾乎不貢獻毛利。四季度粗算下來,C 端毛利率已經(jīng)跌到約2.1%。整體毛利率從12.2% 提升到25.4%,主要是因為 B 端收入比例在四季度快速拉升,把整體數(shù)字拖上來了。
這是一道沒解完的題。
大山不是不能翻越
2025年6月,MiniMax 發(fā)布 M1模型。
閆俊杰在朋友圈發(fā)了一句話:
「第一次感覺到大山不是不能翻越。」
![]()
這句話背后的現(xiàn)實,中美頭部模型技術(shù)能力可能只差5%,但這5% 讓海外公司占據(jù)了價值高出10倍的場景,收取高出10倍的價格,最終形成近百倍的商業(yè)化差距。OpenAI 最新估值超過7000億美元。MiniMax 上市市值800億港元,不到100億美元。
他做過一個判斷,全球未來會有五家頂級 AGI 公司,其中至少兩家來自中國,甚至有一家能做到第一。
1月9日上市之后,他緊接著在1月19日出現(xiàn)在總理主持的專家企業(yè)家座談會上,成為繼 DeepSeek 梁文鋒之后第二位參會的 AI 大模型創(chuàng)始人。
然后3月2日,首份年報出來,港股當天大漲。
財報會上,閆俊杰花了很長時間講一件事:MiniMax 要從「大模型公司」變成「AI 時代的平臺型公司」。
他給平臺價值下了一個公式:智能密度 × Token 吞吐。互聯(lián)網(wǎng)時代的平臺是流量入口,AI 時代的平臺是能定義智能邊界、同時在商業(yè)上吃到紅利的公司。Google 在做,OpenAI 在做,他們也要做。
他面對的對手,體量是他的幾十倍。
港股上市只是把他推到了另一個戰(zhàn)場。季報、分析師、市值壓力,這些東西和寫代碼完全不是一回事。二級市場不相信情懷,只看數(shù)字。C 端的故事能不能轉(zhuǎn)化成毛利,B 端的增速能不能維持,M3什么時候出來,這些問題,接下來每個季度都要回答。
但把視角拉遠一點看,MiniMax 的故事不只是一家公司的故事。
美國這幾年在芯片上卡得越來越緊。A100限售,H100限售,H800也限售。邏輯很直接:掐住算力,就掐住了 AI 的喉嚨。
中國這邊被迫走了一條完全不同的路。
DeepSeek 用 H800跑出了接近 H100的效果。MiniMax 用5億美元干了 OpenAI 花幾百億才干到的事。閆俊杰2023年賭 MoE,原因是手里那點卡根本撐不起億級用戶的推理量。
M2.5連續(xù)工作一小時1美元,是 GPT-5的二十分之一。混合注意力架構(gòu)、線性注意力、CISPO 算法,創(chuàng)新都是被逼出來的。
芯片封鎖的本意是拉大差距,但實際效果是把中國 AI 公司逼進了一條低算力、高效率的進化路線。
錢少,卡少,人少,反而逼出了極致的工程能力和架構(gòu)創(chuàng)新。
這跟華為做芯片的邏輯一樣,你封鎖我一項能力,我就在其他維度補回來,補的過程中,可能長出你沒有的東西。
OpenAI 現(xiàn)在4000多人,2025年燒了80億美元現(xiàn)金,到2030年計劃砸6000億美元的算力。MiniMax 385人,累計花了5億美元。
誰贏還不知道。但至少現(xiàn)在,賭 MiniMax 會死的人越來越少了。
2014年那個在百度實習(xí)的河南博士生,大概不會想到,十二年后他站在的這個位置,背后連著的是一整場國運級別的技術(shù)競爭。
他選擇繼續(xù)跑下去。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.