網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

MiniMax：一個河南縣城青年和他的3000億

2026-03-18 11:02:24　來源: 動察Beating

北京舉報

分享至

文 | 林晚晚

2014年，百度研究院來了個實習(xí)生，中科院自動化所的博士，河南縣城出來的。他給自己算過一筆賬：畢業(yè)后最理想的去處是 IBM，寫 Java，年薪28萬。

2026年春節(jié)，一款叫 OpenClaw 的 Agent 工具全球爆火，開發(fā)者搭龍蝦需要底層大模型撐著。有個模型又快又便宜，一周在 OpenRouter 上吞掉1.44萬億 Token，登頂全平臺第一。

這個模型叫 M2.5，公司叫 MiniMax。

上市兩個月，股價從165港元沖到1300港元，市值破3000億，而它還是一家年收入不到8000萬美元的公司。

做出 MiniMax 的人，就是十二年前那個實習(xí)生，閆俊杰。

提前一年多的賭注

2021年春節(jié)，閆俊杰回河南老家過年，去看了外公。

外公跟他說，想寫一本回憶錄，記錄這80年的人生。但不會打字，也沒辦法把故事好好組織起來，說了幾次，就擱下了。

閆俊杰在 AI 行業(yè)做了十多年。那一刻他突然意識到，他做的這些東西，哪怕已經(jīng)在產(chǎn)業(yè)里落地，幫了多少企業(yè)，但對一個想寫回憶錄的老人來說，一點用都沒有。

這個細節(jié)后來被反復(fù)引用，有點勵志故事的味道。但它確實解釋了一件事：他做 AI 的動機很樸素，讓普通人真的能用上。這股執(zhí)念，后來驅(qū)動了一系列反直覺的決策。

2021年底，他從商湯離職了。

時間點很關(guān)鍵。商湯當時正在準備港股上市，他是副總裁，研究院副院長，智慧城市事業(yè)群 CTO，走的時候是公司最值錢的時候之一。他沒等到上市，沒等到財富兌現(xiàn)，就出來了。

ChatGPT 是2022年11月才發(fā)布的。

MiniMax，2021年12月成立。

這個時間差，是后來一切的基礎(chǔ)。閆俊杰后來自己說，要不是做得早，在后來「明星研究員和大廠 AI 背景更受歡迎」的融資環(huán)境里，MiniMax 根本打不過別人。

他父母都是普通人。高中在縣城讀，考上東南大學(xué)數(shù)學(xué)系，后來中科院自動化所讀博，清華博士后，再進商湯，一步步走出來，沒有任何海外背景，也沒有什么顯赫的人脈起點。

在百度實習(xí)那陣子，他和地平線的余凱有過交集。余凱后來說，學(xué)術(shù)能力可以訓(xùn)練，但能把 AI 技術(shù)工程化落地的人，鳳毛麟角。閆俊杰是其中之一。

進商湯之后，他七年從實習(xí)生做到副總裁。2018年，在人手不夠的情況下，他帶隊做出了一套「All for One」模型算法，在競標里反超曠視和依圖，拿到行業(yè)第一。有人評價他「看論文速度奇快，不管陳詞濫調(diào)，只看精華要義」。這種效率，后來成了 MiniMax 的公司文化。

他給公司取名 MiniMax，來自博弈論里馮·諾依曼的極小化極大算法。

他的解釋是，做決策要先防住最壞的風(fēng)險，再選相對最優(yōu)解。

一張奇特的股東表

2021年12月，MiniMax 完成天使輪，3100萬美元，投前估值1.7億美元。進來的有米哈游、IDG、高瓴、云啟。

米哈游那筆錢有點特別。閆俊杰和米哈游董事長劉偉私交不錯，天使輪就進來了，現(xiàn)在劉偉還在 MiniMax 的董事會里掛著非執(zhí)行董事。

米哈游本身就是 MiniMax 的客戶，游戲里的 NPC 對話、劇情生成，都在用他們的模型。

天使輪之后，故事遭遇了一個小插曲。

2023年3月，硅谷銀行宣布破產(chǎn)。MiniMax 當時所有資金都在那家銀行。這是創(chuàng)業(yè)初期最險的一次，錢沒了，融資環(huán)境還一片混亂。但他們撐過去了，兩個月后拿到 A 輪2.57億美元，估值11.57億美元。

接下來的名單越來越夸張。阿里進來了，騰訊進來了，紅杉跟了進去。到上市前，7輪融資，累計近15億美元，估值42億美元。IPO 后阿里持股12.52%，是最大外部股東。

閆俊杰早期融資有一個習(xí)慣：只和投資機構(gòu)的最高位談。他見了紅杉的沈南鵬，見了高瓴的張磊。

但這張股東表上還有一個人值得單獨講：贠燁祎。

1994年生，約翰·霍普金斯大學(xué)電子工程本科，輔修經(jīng)濟學(xué)和數(shù)學(xué)。2017年本科一畢業(yè)就進商湯，干的是融資與戰(zhàn)略投資，一年后升任 CEO 徐立的行政助理兼戰(zhàn)略部總監(jiān)。她深度參與了商湯從早期到港股上市的整個過程。

2021年，她和閆俊杰一起出來創(chuàng)業(yè)。

有投資人評價她「干練、有氣場、執(zhí)行力強，有種超出其年齡的成熟」。她和閆俊杰的分工很清晰：一個定義技術(shù)愿景，一個把愿景變成錢和資源。閆俊杰能鉆進技術(shù)里，頭發(fā)都剃光了也無所謂，但市場、資本、全球化，是贠燁祎的戰(zhàn)場。

上市敲鐘那天，兩個人站在同一個臺子上。贠燁祎31歲，身價超過40億港元。

385人和1% 的錢

MiniMax 上市時，全公司385人，平均年齡29歲。

公司從成立到2025年9月，累計花費約5億美元。OpenAI 同期花了400億到550億美元。

這個對比有點荒謬。用不到對手1% 的錢，做出了全模態(tài)全球領(lǐng)先的公司。省錢只是結(jié)果。真正的原因是他們把 AI 用到了極致。

公司80% 的代碼由 AI 完成，內(nèi)部管 AI 叫「實習(xí)生」，這些實習(xí)生權(quán)限高到可以直接訪問代碼庫、改線上環(huán)境，飛書里和它聊幾句，review 完直接上線。

這種效率讓 MiniMax 的人均產(chǎn)出高到不正常。

產(chǎn)品層面，他們從一開始就走全模態(tài)路線：語言、視頻、語音、音樂，四個方向同時壓。別人都在學(xué) ChatGPT 做對話，閆俊杰押的是多模態(tài)融合。他的判斷是，多模態(tài)是持續(xù)提升智能的基本前提，不做全模態(tài)，下一代模型就沒有機會。

2023年夏天，他做了一個更激進的決定。

把80% 的算力和研發(fā)資源，全部壓到 MoE（混合專家系統(tǒng)）上。

那個時候，國內(nèi)主流還在迭代稠密模型，MoE 被認為是「前沿但不成熟」的技術(shù)。閆俊杰的邏輯很簡單：如果要服務(wù)千萬級、億級用戶，生成 token 的成本和延時，用稠密模型根本撐不住。不做 MoE，規(guī)模上不去，一切都是白搭。

2024年初，MiniMax 發(fā)布了國內(nèi)首個 MoE 大模型。

產(chǎn)品上，他們也沒有去卷國內(nèi)市場。C 端做了星野和 Talkie，一個在國內(nèi)，一個在海外，做 AI 陪伴；海螺 AI 做視頻生成，2024年下半年連續(xù)半年全球視頻生成應(yīng)用月活第一。

現(xiàn)在的數(shù)字：2.36億用戶，覆蓋200個國家和地區(qū)，海外收入占73%。B 端21.4萬企業(yè)客戶和開發(fā)者，Google Vertex AI、微軟 Azure、AWS 都已經(jīng)部署了 MiniMax 的模型，Notion 首個開源模型選擇，也是 MiniMax。

2月的 ARR 突破了1.5億美元，M2系列單日 Token 消耗量是去年12月的6倍，其中編程方向增長超10倍。

這才是市場愿意給200倍市銷率的原因。

但有一組數(shù)字要拆開看。

年報里，C 端毛利率4.7%，B 端毛利率69.4%。公司67% 的收入來自 C 端，但 C 端幾乎不貢獻毛利。四季度粗算下來，C 端毛利率已經(jīng)跌到約2.1%。整體毛利率從12.2% 提升到25.4%，主要是因為 B 端收入比例在四季度快速拉升，把整體數(shù)字拖上來了。

這是一道沒解完的題。

大山不是不能翻越

2025年6月，MiniMax 發(fā)布 M1模型。

閆俊杰在朋友圈發(fā)了一句話：

「第一次感覺到大山不是不能翻越。」

這句話背后的現(xiàn)實，中美頭部模型技術(shù)能力可能只差5%，但這5% 讓海外公司占據(jù)了價值高出10倍的場景，收取高出10倍的價格，最終形成近百倍的商業(yè)化差距。OpenAI 最新估值超過7000億美元。MiniMax 上市市值800億港元，不到100億美元。

他做過一個判斷，全球未來會有五家頂級 AGI 公司，其中至少兩家來自中國，甚至有一家能做到第一。

1月9日上市之后，他緊接著在1月19日出現(xiàn)在總理主持的專家企業(yè)家座談會上，成為繼 DeepSeek 梁文鋒之后第二位參會的 AI 大模型創(chuàng)始人。

然后3月2日，首份年報出來，港股當天大漲。

財報會上，閆俊杰花了很長時間講一件事：MiniMax 要從「大模型公司」變成「AI 時代的平臺型公司」。

他給平臺價值下了一個公式：智能密度 × Token 吞吐。互聯(lián)網(wǎng)時代的平臺是流量入口，AI 時代的平臺是能定義智能邊界、同時在商業(yè)上吃到紅利的公司。Google 在做，OpenAI 在做，他們也要做。

他面對的對手，體量是他的幾十倍。

港股上市只是把他推到了另一個戰(zhàn)場。季報、分析師、市值壓力，這些東西和寫代碼完全不是一回事。二級市場不相信情懷，只看數(shù)字。C 端的故事能不能轉(zhuǎn)化成毛利，B 端的增速能不能維持，M3什么時候出來，這些問題，接下來每個季度都要回答。

但把視角拉遠一點看，MiniMax 的故事不只是一家公司的故事。

美國這幾年在芯片上卡得越來越緊。A100限售，H100限售，H800也限售。邏輯很直接：掐住算力，就掐住了 AI 的喉嚨。

中國這邊被迫走了一條完全不同的路。

DeepSeek 用 H800跑出了接近 H100的效果。MiniMax 用5億美元干了 OpenAI 花幾百億才干到的事。閆俊杰2023年賭 MoE，原因是手里那點卡根本撐不起億級用戶的推理量。

M2.5連續(xù)工作一小時1美元，是 GPT-5的二十分之一。混合注意力架構(gòu)、線性注意力、CISPO 算法，創(chuàng)新都是被逼出來的。

芯片封鎖的本意是拉大差距，但實際效果是把中國 AI 公司逼進了一條低算力、高效率的進化路線。

錢少，卡少，人少，反而逼出了極致的工程能力和架構(gòu)創(chuàng)新。

這跟華為做芯片的邏輯一樣，你封鎖我一項能力，我就在其他維度補回來，補的過程中，可能長出你沒有的東西。

OpenAI 現(xiàn)在4000多人，2025年燒了80億美元現(xiàn)金，到2030年計劃砸6000億美元的算力。MiniMax 385人，累計花了5億美元。

誰贏還不知道。但至少現(xiàn)在，賭 MiniMax 會死的人越來越少了。

2014年那個在百度實習(xí)的河南博士生，大概不會想到，十二年后他站在的這個位置，背后連著的是一整場國運級別的技術(shù)競爭。

他選擇繼續(xù)跑下去。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.