網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

深扒Minimax與智譜：大模型，一場算力強(qiáng)度與融資耐力的殘酷絕殺？

2026-01-26 20:39:52　來源: 海豚投研

浙江舉報(bào)

分享至

26年初ChatGPT發(fā)布三年之際，中國兩大AI大模型創(chuàng)業(yè)公司Minimax和智譜幾乎同時(shí)，均以大約60億美金的估值上市，且上市后都以暴漲，并帶動(dòng)整個(gè)AI應(yīng)用的普漲行情。但同時(shí)，扒開兩個(gè)大模型公司的報(bào)表，都是“虧無止境”的面相。

一邊是全球大模型瘋狂卷價(jià)格、越來越多大宗商品，一邊是模型無底洞的研發(fā)投入，但同時(shí)還有這種即翻倍的盛景。冰火交織下，海豚君一直的疑問是大模型到底是一種什么樣的生意。

這次，海豚君就結(jié)合兩個(gè)上市的公司數(shù)據(jù)，來認(rèn)真探討一下這個(gè)問題：

1）大模型到底需要怎樣的投入要素和密度？

2）算力到底扮演了什么角色？

3）模型經(jīng)濟(jì)學(xué)如何算，才能平衡？

4）最終，大模型到底是怎樣的生意模式？

以下是詳細(xì)分析

一、拔高的收入、驚悚的投入

兩個(gè)大模型公司Minimax和智譜，都是“短小精悍”型——人手少、產(chǎn)品迭代快，收入增長快。人數(shù)到2025年下半年沒超一千人，收入零起步，兩三年年化收入都在快速邁向一億美金。

但到了支出層，再高增的收入都被兇猛的投入比得相形見絀：即使收入增長過程中，Model to B公司智譜持續(xù)保持在50%的高毛利，還是Model to C公司Minimax毛利率翻正。

2024年兩個(gè)公司的支出（成本與運(yùn)營開支）加總基本在當(dāng)期收入的10倍上下。Minimax 2025年前九個(gè)月收入快速做大后支出仍然是收入的5倍以上；而智譜到了2025年上半年看起來反而更加規(guī)模不經(jīng)濟(jì)了。

這里的核心問題是，對(duì)于模型公司而言，到底收入越大、虧損率收窄，還是收入越大、虧損率越高的規(guī)模不經(jīng)濟(jì)結(jié)局？

模型經(jīng)濟(jì)學(xué)的底層三要素——數(shù)據(jù)、算力、算法，大家已耳熟能詳。但要解答模型到底適不適用互聯(lián)網(wǎng)規(guī)模經(jīng)濟(jì)規(guī)模，關(guān)鍵是理解大模型到底需要怎樣的投入密度。

在大語言模型訓(xùn)練中，用了什么訓(xùn)練數(shù)據(jù)從來沒有模型廠真正公開，但這個(gè)問題大致有這么兩個(gè)共識(shí); a.公共語料庫有百科、代碼庫、Common Crawl語料庫等; b.但公共和標(biāo)準(zhǔn)語料庫幾乎已被模型訓(xùn)練完畢。

到了2026年，大模型公司開始依賴合成數(shù)據(jù)和思維連數(shù)據(jù)。但未來，要給模型投喂更多數(shù)據(jù)，要么靠自身超快的落地速度去接入更多場景；要么大模型公司本有自有數(shù)據(jù)，比如說互聯(lián)網(wǎng)大廠更具數(shù)據(jù)優(yōu)勢(shì)；剩下就是比拼對(duì)私有數(shù)據(jù)的付費(fèi)能力。

但數(shù)據(jù)投喂量因涉及數(shù)據(jù)合規(guī)和隱私等，沒有模型廠會(huì)在報(bào)表中展示。真正能體現(xiàn)在報(bào)表端的，主要是算力和算法，算法的精進(jìn)本質(zhì)是靠人，算力對(duì)應(yīng)的是芯片和云服務(wù)。對(duì)于這兩個(gè)問題，我們就一個(gè)一個(gè)來看一下。

二、人太貴了？不是核心問題！

兩個(gè)公司員工整體都沒超1000人，尤其是Minimax都不足400人；兩家公司研發(fā)人員都接近75%，單人頭月成本6.5-8.5萬元人民幣（不含期權(quán)激勵(lì)），其中Minimax研發(fā)人員單人月成本是16萬。

Minimax因人員更為精煉，收入做大過程中，薪資支出至少已能夠收入覆蓋。而智譜因?yàn)樯虡I(yè)變現(xiàn)上主要是to B落地，需要匹配更多銷售人員；而且研發(fā)上對(duì)通用模型著力更高，所以人力成本改善并不明顯。

其實(shí)，從這兩家公司可以看出，大模型在人力上的投入，更多是人才“腦力”密度的投入，而非人力密度的投入。甚至從Minimax的人才密度，可能已經(jīng)預(yù)示了AI時(shí)代互聯(lián)網(wǎng)公司的人力結(jié)構(gòu)雛形：

少而精的大模型研發(fā)人才，大量其他的部門崗位都在被模型取代（Minimax旗下AI產(chǎn)品眾多，但并未對(duì)應(yīng)超大的人頭量），總體薪資呈現(xiàn)出單人薪資超高，但總體可控的狀態(tài)。

比如Minimax一年總薪資支出大約1億美金（大約收入的90%上下），考慮到這兩家公司基座模型的迭代能力和多模態(tài)的發(fā)布速度、海外AI動(dòng)輒上億美金的搶人戰(zhàn)慘烈程度（動(dòng)輒挖一人開出的薪資就上億美金），這樣的人員支出還不算夸張。

三、核心矛盾：創(chuàng)收 vs 投入，到底能有平衡的時(shí)候嗎？

雖然薪資成本基本已經(jīng)把當(dāng)期的收入“吃光了”。相比于算力投入，人力薪資只是小菜一碟。薪資至少可以隨著收入的擴(kuò)張而有效稀釋，但算力投入從兩家目前的情況看下來，是一個(gè)比收入增長斜率更高的投入類型。

而且從報(bào)表上來看，由于Minimax和智譜固定資產(chǎn)開支都非常少，幾乎可以確定，兩家公司的算力都是使用的第三方云服務(wù)，這種相對(duì)輕資產(chǎn)的模式，而非OpenAI高度自控?cái)?shù)據(jù)中心的方式。

大模型公司的報(bào)表中，算力的使用都分為了訓(xùn)練算力和推理算力。

模型在訓(xùn)練階段，就等于要做出來一個(gè)可以產(chǎn)生經(jīng)濟(jì)效益的商品和服務(wù)，需要做研發(fā)投入，在產(chǎn)品投用（模型進(jìn)入推理場景）之前，對(duì)應(yīng)的模型訓(xùn)練支出，都是推出產(chǎn)品之前的“沉淀支出”，計(jì)入研發(fā)費(fèi)用當(dāng)中。

而研發(fā)好的模型投入了推理使用場景中，產(chǎn)生的收益記為收入，而推理階段模型對(duì)于算力的消耗，就記為收入創(chuàng)造過程中的直接成本，記在成本項(xiàng)當(dāng)中。

背后的邏輯也簡單：大模型公司砸人、砸算力、砸數(shù)據(jù)先在實(shí)驗(yàn)室里做模型的研發(fā)，這個(gè)是無論模型是否做出為客戶所用，是模型公司都必須要做“沉淀投入”。

只有當(dāng)模型被研發(fā)出來，可以用到推理環(huán)節(jié)，無論是客戶調(diào)用模型接口還是自己直接用模型做出來APP來產(chǎn)生收入，才會(huì)產(chǎn)生推理收入和推理計(jì)算的成本。

這Minimax和智譜兩家公司來看，為了研發(fā)模型，單單訓(xùn)練算力投入全部占到了總支出的50%以上，是開支的絕對(duì)大頭，也是妥妥的“吸金黑洞”，貢獻(xiàn)了兩家公司5-10倍虧損率中的一半以上的支出。

這一占比，直接量化了海豚君在《》中所說的算力吸空產(chǎn)業(yè)鏈利潤的說法。

再拿收入創(chuàng)造和模型訓(xùn)練投入相比，就更能直觀感受到訓(xùn)練投入的強(qiáng)度了：

從Minimax來看，2024年創(chuàng)收只有23年模型訓(xùn)練算力投入的65%，25年前三季度雖然收入成長很快，但也對(duì)24年同期訓(xùn)練算力成本覆蓋能力反而進(jìn)一步降低到了50%；智譜到25年上半年更是僅有30%的覆蓋率。

Minimax由于產(chǎn)品落地上，以海外to C情感AI陪聊為主，設(shè)計(jì)上有很多游戲和互聯(lián)網(wǎng)增值的變現(xiàn)模式（詳細(xì)產(chǎn)品和商業(yè)化落地會(huì)另外詳細(xì)分析），to C的互聯(lián)網(wǎng)規(guī)模效應(yīng)+海外付費(fèi)能力較強(qiáng)，收入對(duì)訓(xùn)練成本情況壓力尚小一些。

但智譜的情況就是一個(gè)非常明顯的收入高增，但對(duì)訓(xùn)練成本的回收能力，因?yàn)橛?xùn)練成本增長斜率更高，反而越來越弱。

這兩年趨勢(shì)看，雖然兩家作為中國獨(dú)立模型公司的佼佼者，收入增長斜率都很高，但當(dāng)年創(chuàng)收對(duì)上一年研發(fā)投入的代償全都不盡如人意。

模型要優(yōu)秀，訓(xùn)練成本就越高；收入跑得再快，也跟不上一代更比一代高的模型投入。那么矛盾來了，模型越做越虧，這種生意如何理解商業(yè)價(jià)值？

四、大模型到底是怎樣的商業(yè)模式？

大模型動(dòng)輒1000%的虧損率，再次形象地說明了它的研發(fā)是一個(gè)人才+算力+數(shù)據(jù)三重密集的商業(yè)模式。

強(qiáng)投入和快迭代的共振，在海豚君看來，本質(zhì)上是把一個(gè)強(qiáng)資產(chǎn)負(fù)債表的資金密集性業(yè)務(wù)，做成了“全長在”利潤表上的生意。

而當(dāng)它具備長期的經(jīng)濟(jì)和商業(yè)價(jià)值的時(shí)候，就是模型回歸成真正的“資產(chǎn)負(fù)債表”業(yè)務(wù)——模型不再需要年年投，而是投一年的訓(xùn)練成本可管之后10年甚至20年，讓模型持續(xù)產(chǎn)生收入。這個(gè)時(shí)候，訓(xùn)練成本可以做長期攤銷的時(shí)候，也只有這樣，模型研發(fā)的訓(xùn)練成本才會(huì)有研發(fā)資本化的真正商業(yè)基礎(chǔ)。具體來看：

1）算力：節(jié)節(jié)高的“固定資產(chǎn)投入”

Minimax和智譜為例，23年研發(fā)一代模型，訓(xùn)練成本要四、五千萬美金之間；而下一代模型的訓(xùn)練要實(shí)現(xiàn)代際的線性差異，在數(shù)據(jù)量、模型參數(shù)量和算力投入反而是指數(shù)級(jí)的提升。最終算力效率提升，反而拉高了算力的總需求量。

從這兩家公司來看，模型升級(jí)一代，訓(xùn)練成本基本要提高3-5倍。

當(dāng)下大模型的競爭節(jié)奏，基本都是一年出一代模型。也就是說之前一年訓(xùn)練出的模型，只對(duì)應(yīng)接下來一年的推理創(chuàng)收期。

這么高的算力投入，沒有辦法做攤銷折舊，只能全部計(jì)入當(dāng)期的研發(fā)費(fèi)用當(dāng)中，結(jié)果就是上文高于收入5-10倍的虧損這種 “慘不忍睹”的虧損率。

2）快迭代：收入vs 投入，追不上的“貓鼠游戲”？

智譜和Minimax兩家公司面臨的共同情況都是，模型的創(chuàng)收能力尚且覆蓋無法模型的算力投入。雖然收入跑不過訓(xùn)練成本，一邊狂虧一邊狂投，幾乎是研發(fā)大模型必然的宿命。

為了讓自己活到黎明時(shí)刻，公司要把這代模型的創(chuàng)收，再考慮上研發(fā)薪資支出，幾乎要再貼上高于收入3-5倍的融資資金，才能為下一代的模型研發(fā)續(xù)命，以保證模型不被市場淘汰。

而這樣一直滾雪球下去，就是一個(gè)收入一直追不上未來投入；且只要還在大模型競爭的牌桌上，就需要不斷融資，而且越做大、融資窟窿越大的“資本比拼”游戲。

3）縮放定律失效：資本游戲結(jié)束？

一個(gè)自然而然的問題是，這么下去，到底什么時(shí)間才是個(gè)頭？很顯然，在成本端投入巨大的情況下，這里矛盾的核心已不是簡單的收入成長速度能否匹配訓(xùn)練成本增速的問題，更加重要的問題是，什么時(shí)間模型不需要這么大的投入，或者迭代速度不需要這么快了。

對(duì)于大模型技術(shù)本身而言，不需要投入的時(shí)候，其實(shí)就是縮放定律（scaling law）失效的時(shí)候，換句話說，當(dāng)增加一點(diǎn)點(diǎn)的智力所需要的算力開始暴漲式上升的時(shí)候，模型訓(xùn)練的必要性就不大了。

模型不再需要高頻的訓(xùn)練來迭代，也意味著高密集的訓(xùn)練重資產(chǎn)投入告一段落。算力投入一代新模型后，這代模型能有10年甚至更長的時(shí)間來創(chuàng)收。甚至當(dāng)模型不再需要訓(xùn)練投入，但大模型能夠一直創(chuàng)收，這時(shí)一個(gè)類似“長江電力”的商業(yè)模式也就呼之欲出了。

但這個(gè)假設(shè)的基本前提是，頭部大模型廠商在長期的資本、人力和數(shù)據(jù)消耗戰(zhàn)中，已經(jīng)熬死了一眾對(duì)手，僅剩的幾個(gè)對(duì)手之間達(dá)成默契，不再打價(jià)格戰(zhàn)，最終形成類似當(dāng)下云服務(wù)市場一樣、市占率高度集中的寡頭市場，那么大模型的商業(yè)模式自然也就立住了。

4）終局之前，是殘酷的資本游戲

但縮放定律失效時(shí)刻到來之前，大模型公司會(huì)是持續(xù)的吞金獸。這種情況下，商業(yè)模式的競爭本質(zhì)上就變成了一場持續(xù)融資的資本競賽。

當(dāng)然，如果像蔚來一樣，真有大模型公司能把融資做成一種差異化的生存能力，確實(shí)也是一項(xiàng)核心技能。但對(duì)于大多數(shù)公司而言，融資不是博傻游戲，資金愿意融資，本身是要看企業(yè)的產(chǎn)品和執(zhí)行能力，能融到資金，而且估值越來越高，本身也是一個(gè)雙向選擇的過程。

按媒體報(bào)道，中國的模型之戰(zhàn)，也已經(jīng)從剛開始的百模之戰(zhàn)走到基模五強(qiáng)——字節(jié)、阿里、階躍、智譜和DeepSeek。

原本的模型創(chuàng)業(yè)“六小龍”階躍、智譜、MiniMax、百川智能、月之暗面與零一萬物中，在DeepSeek一夜爆紅并用完全的開源顛覆了模型收費(fèi)之后，零一萬物和百川智能已經(jīng)掉隊(duì)。

海外同樣也已經(jīng)變成五虎爭霸：OpenAI、Anthropic、谷歌Gemini、xAI和 Meta Llama，甚至Meta的模型也已經(jīng)落后。

一些能夠持續(xù)融資且估值能夠水漲船高、有一些在快速的死在了半路上。從大模型生存的路徑來看，融資能力背后真正的是核心人才、模型實(shí)力和產(chǎn)品落地進(jìn)度能力綜合作用的結(jié)果。

核心人才是AI的上億美金搶人大賽，這個(gè)還是持續(xù)進(jìn)行中，而另外兩個(gè)一個(gè)看模型本身智能化程度，而另外一個(gè)最終要落地到創(chuàng)收能力上。

1）模型實(shí)力：

從下文可以看到，模型創(chuàng)業(yè)公司能生存下來，大多在模型的榜單上能找得到名字，這背后是模型在各個(gè)細(xì)分顆粒度上（模型智能化程度、幻覺率、模型參數(shù)、回答時(shí)首個(gè)Token輸出前的等待時(shí)長等）的競爭相對(duì)靠前。

2）產(chǎn)品落地能力

過去一年中，多數(shù)獨(dú)立創(chuàng)業(yè)公司，要么在與互聯(lián)網(wǎng)大廠競爭中被挖走了人，要么產(chǎn)品落地上創(chuàng)收困難，要么是模型價(jià)格比拼中，干不過性價(jià)比高的開源模型，模型隱沒在了半路上。

如果用一句話來概括的話，在Scaling Law撞墻的“黎明時(shí)分”之前，甚至到來之后的一段時(shí)間內(nèi)，我們都會(huì)看到一個(gè)個(gè)模型在“人才搶奪、模型研發(fā)和產(chǎn)品落地”三維度的比拼中，一個(gè)個(gè)倒下去。

而真正能走向決賽的，除了看人和背后的資金實(shí)力，更加重要的是看模型研發(fā)的進(jìn)度和產(chǎn)品落地的水平。

下一篇分析，海豚君就會(huì)圍繞智譜和Minimax的模型和產(chǎn)品落地，來理解如何去評(píng)價(jià)大模型的資本市場價(jià)值。

//轉(zhuǎn)載開白

本文為海豚研究原創(chuàng)文章，如需轉(zhuǎn)載請(qǐng)?zhí)砑游⑿牛篸olphinR124 獲得開白授權(quán)。

//免責(zé)聲明及一般披露提示

本報(bào)告僅作一般綜合數(shù)據(jù)之用，旨在海豚研究及其關(guān)聯(lián)機(jī)構(gòu)之用戶作一般閱覽及數(shù)據(jù)參考，並未考慮接獲本報(bào)告之任何人士之特定投資目標(biāo)、投資產(chǎn)品偏好、風(fēng)險(xiǎn)承受能力、財(cái)務(wù)狀況及特別需求投資者若基於此報(bào)告做出投資前，必須諮詢獨(dú)立專業(yè)顧問的意見。任何因使用或參考本報(bào)告提及內(nèi)容或信息做出投資決策的人士，需自行承擔(dān)風(fēng)險(xiǎn)。海豚研究毋須承擔(dān)因使用本報(bào)告所載數(shù)據(jù)而可能直接或間接引致之任何責(zé)任或損失。本報(bào)告所載信息及數(shù)據(jù)基於已公開的資料，僅作參考用途，海豚研究力求但不保證相關(guān)信息及數(shù)據(jù)的可靠性、準(zhǔn)確性和完整性。

本報(bào)告中所提及之信息或所表達(dá)之觀點(diǎn)，在任何司法管轄權(quán)下的地方均不可被作為或被視作證券出售邀約或證券買賣之邀請(qǐng)，也不構(gòu)成對(duì)有關(guān)證券或相關(guān)金融工具的建議、詢價(jià)及推薦等。本報(bào)告所載資訊、工具及資料並非用作或擬作分派予在分派、刊發(fā)、提供或使用有關(guān)資訊、工具及資料抵觸適用法例或規(guī)例之司法權(quán)區(qū)或?qū)е潞ｋ嘌芯考埃蚱涓綄俟净蚵?lián)屬公司須遵守該司法權(quán)區(qū)之任何註冊(cè)或申領(lǐng)牌照規(guī)定的有關(guān)司法權(quán)區(qū)的公民或居民。

本報(bào)告僅反映相關(guān)創(chuàng)作人員個(gè)人的觀點(diǎn)、見解及分析方法，並不代表海豚研究及/或其關(guān)聯(lián)機(jī)構(gòu)的立場。

本報(bào)告由海豚研究製作，版權(quán)僅為海豚研究所有。任何機(jī)構(gòu)或個(gè)人未經(jīng)海豚研究事先書面同意的情況下，均不得(i)以任何方式製作、拷貝、複製、翻版、轉(zhuǎn)發(fā)等任何形式的複印件或複製品，及/或(ii)直接或間接再次分發(fā)或轉(zhuǎn)交予其他非授權(quán)人士，海豚研究將保留一切相關(guān)權(quán)利。

文章不易，點(diǎn)個(gè)“分享”，給我充點(diǎn)兒電吧~

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.