![]()
智譜、MiniMax 先后啟動上市,大模型賽道正在進入新一輪資金與算力的“軍備競賽”。
就在這一節點上,《晚點 LatePost》獨家獲悉,月之暗面(Kimi)近期完成 5 億美元 C 輪融資,阿里、騰訊、王慧文等投資方超額認購,投后估值 43 億美元。
一個容易被忽視的細節是,這輪融資規模折合人民幣約 35 億元,與智譜、MiniMax 在 IPO 階段的募資規模相當。換句話說,Kimi僅通過一級市場,就完成了其他科技公司需要借助二級市場才能實現的融資體量。
這種情況并不常見。
眾所周知,一級市場與二級市場的核心邏輯并不相同。二級市場強調確定性、可驗證的業績與路徑,而一級市場更關注長期賠率,押注的是未來可能出現的非線性回報。
在這樣的分工之下,Kimi能夠在一級市場完成如此規模的融資,本身就釋放出一個明確信號:投資人已經在它身上形成了高度一致的判斷。
這種共識,或許才是Kimi當前最重要、也最具稀缺性的價值所在。
5億美元融資背后的三個信號
5億美元融資、100億人民幣現金儲備,在這一連串數字背后,有三個值得注意的市場信號:
首先,僅依靠一級市場,Kimi已經完成了過去通常只能在二級市場實現的融資體量。
作為對比,2025 年 9 月,寒武紀通過定增募資約 40 億元人民幣;根據公開信息,智譜港股 IPO 的總募資額約為 43 億港元,MiniMax 的 IPO 融資規模則在 38.18 億元左右。
而月之暗面這一輪 C 輪融資金額為 5 億美元,折合人民幣約 35 億元,幾乎與多家科技公司通過 IPO 或定增獲得的資金規模相當。
換句話說,在不進入二級市場的前提下,Kimi已經完成了一次“等量級”的資本補給。
第二個更關鍵的變化在于,Kimi在一級市場階段,就已擁有極為充沛的現金儲備。
截至 12 月 31 日,公司賬上現金超過 100 億元人民幣。這一水平,已經不遜于多家完成 IPO 后的頭部大模型公司。
根據招股書披露的數據,截至 2025 年 6 月,智譜賬上現金為 25.5 億元人民幣,若疊加 IPO 預計募資的約 38 億元,總現金規模約為 63.5 億元;截至 2025 年 9 月,MiniMax 的現金儲備約為 73.5 億元,疊加 IPO 預計募資 34 億至 38 億元,總規模在 107 億元左右。
從這個維度看,Kimi在未上市的情況下,已經具備了與 IPO 公司相當的“彈藥厚度”,也因此并不急于登陸二級市場,獲得了更長的技術和產品發育窗口。
第三,這輪融資推進速度極快,且老股東持續加注。
據《晚點 LatePost》了解,從啟動到落定,這輪融資前后用時不足兩個月,屬于明顯的超額融資。阿里、騰訊、王慧文等老股東均選擇繼續加碼,其中王慧文對Kimi的累計投資金額已達 7000 萬美元。
在當前一級市場整體趨于謹慎的背景下,如此高效的融資節奏,意味著投資人之間已經形成了高度一致的判斷。
問題隨之浮現,在算力成本高企、模型競賽持續加碼的當下,投資人究竟在月之暗面身上看到了什么,愿意在一級市場階段,就押下如此重的籌碼?
這,或許才是這輪融資背后真正值得討論的地方。
拆解Kimi的三個“全壘打”邏輯
在回答“為什么是Kimi”之前,需要先回到一級市場本身的投資邏輯。
在 VC 行業里,有一個被反復引用的經典理論,叫 “魯斯效應”(Babe Ruth Effect)。
這一說法來自美國棒球史上最具傳奇色彩的球員 Babe Ruth。他是歷史上第一位在單賽季打出 60 個全壘打的球員,這一紀錄保持了 34 年。在整個職業生涯中,他始終做出同一個選擇:放棄更高頻、更穩定的安打概率,轉而追求成功率更低、但回報“振幅”極大的全壘打。
后來,投資界將這種策略總結為“魯斯效應”:真正決定回報上限的,不是成功的次數,而是單次成功的規模。
Peter Thiel 也在不同場合反復表達過類似判斷——極少數頭部項目,最終會貢獻絕大多數回報;越早理解這一點,越可能成為一個成功的 VC。
放到Kimi身上,它恰恰符合這一邏輯所偏好的“高振幅”特征。這種可能性,主要體現在三個方面。
第一,在Kimi這家公司身上,能夠看到一種罕見的聚焦。
在當前大模型行業,多模態幾乎已經成為共識方向。無論是國內的智譜、MiniMax,還是海外的 Google,都在將多模態作為重要突破口。原因并不復雜:多模態所需資源相對可控,產品形態更直觀,也更容易落地變現。
Kimi卻是一個例外。他們刻意收緊業務邊界:不做生活娛樂方向,不做多模態生成業務,而是長期專注在大模型層、邏輯層和 Agent 層,聚焦深入研究、PPT 生成、數據分析、網站開發等偏生產力、偏復雜任務的鏈路。
從更長的時間尺度看,不做什么,往往比做什么更重要,也更困難。 對一家資源并不無限的模型公司而言,這種克制本身就是一種罕見能力。
第二,是已經被驗證過的技術能力。
今年下半年,月之暗面連續發布了 Kimi K2 與 Kimi K2 Thinking 兩個關鍵模型,基本奠定了其在開源模型體系中的位置。
其中,Kimi K2 Thinking 在 HLE、推理能力和 Agent 相關指標上,超過了 GPT-5 和 Claude Sonnet 4.5 等閉源模型,站上全球開源模型的第一梯隊。
更具象的信號來自生態側。Kimi K2 Thinking成為估值千億的AI 搜索產品 Perplexity 目前唯一接入的國產模型。上一次獲得這一位置的中國模型,還是曾一度風頭無兩的 DeepSeek R1。
模型表現之外,更值得注意的是其背后的技術取向。
Kimi在萬億參數級模型預訓練中,首次引入二階優化器 Muon。
官方披露,在完成 15.5T token 訓練的同時,模型全程沒有出現一次 loss spike(損失激增),訓練穩定性與 token 使用效率均顯著提升。
同時,公司還推出了下一代 Kimi Delta Attention 架構,通過混合線性注意力機制,在提升推理效果的同時,將推理成本降低到原來的數分之一。
在一次 AMA 中,團隊曾回應外界質疑:“你可能會認為我們選擇 Muon 只是運氣好,但在此之前,有幾十種優化器和架構方案都沒有通過驗證。”
這些細節共同指向一點:這不是一次偶然的成功,而是長期工程優勢的結果。
第三,是高賠率之下,正在顯現的確定性。
Meta 收購 Manus,讓市場看到了通用智能體(General Agent)的巨大價值。但在通往 Agent 的路徑上,存在兩種截然不同的思路:
應用層的思路(如 Manus): 基于現有模型,通過“逆向工程”搭建腳手架。無論是 System Prompt 還是 Context Engineering,本質上是在外部“教”模型怎么用工具。
模型層的思路(如Kimi): 這是一種正向思路。在訓練階段就將工具使用、環境交互納入模型的內生能力。模型不是“被教導”去適應環境,而是“生來”就適應環境。
楊植麟曾用一句話概括這兩種思路的差異:方向不同,但后者的上限可能更高。理由是,模型在天然的環境里表現更好,這種“原生性”是外部工程無法比擬的護城河。
這一邏輯正在被市場驗證。楊植麟在內部信中透露,公司全球付費用戶數月增速達 170%。11 月以來,受 K2 Thinking 強推理能力的帶動,其海外 API 收入增長了 4 倍。
總的來說,在算力成本高企、模型競賽持續加碼的背景下,對于Kimi的投資人來說,他們看到的,或許不是一家“短期確定盈利”的公司,而是一條賠率極高、同時已顯露出確定性輪廓的技術路徑。
這,才是Kimi在一級市場迅速達成共識的真正原因。
文/林白
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.