26年初ChatGPT發(fā)布三年之際,中國兩大AI大模型創(chuàng)業(yè)公司Minimax和智譜幾乎同時(shí),均以大約60億美金的估值上市,且上市后都以暴漲,并帶動(dòng)整個(gè)AI應(yīng)用的普漲行情。但同時(shí),扒開兩個(gè)大模型公司的報(bào)表,都是“虧無止境”的面相。
![]()
一邊是全球大模型瘋狂卷價(jià)格、越來越多大宗商品,一邊是模型無底洞的研發(fā)投入,但同時(shí)還有這種即翻倍的盛景。冰火交織下,海豚君一直的疑問是大模型到底是一種什么樣的生意。
這次,海豚君就結(jié)合兩個(gè)上市的公司數(shù)據(jù),來認(rèn)真探討一下這個(gè)問題:
1)大模型到底需要怎樣的投入要素和密度?
2)算力到底扮演了什么角色?
3)模型經(jīng)濟(jì)學(xué)如何算,才能平衡?
4)最終,大模型到底是怎樣的生意模式?
以下是詳細(xì)分析
一、拔高的收入、驚悚的投入
兩個(gè)大模型公司Minimax和智譜,都是“短小精悍”型——人手少、產(chǎn)品迭代快,收入增長快。人數(shù)到2025年下半年沒超一千人,收入零起步,兩三年年化收入都在快速邁向一億美金。
![]()
但到了支出層,再高增的收入都被兇猛的投入比得相形見絀:即使收入增長過程中,Model to B公司智譜持續(xù)保持在50%的高毛利,還是Model to C公司Minimax毛利率翻正。
2024年兩個(gè)公司的支出(成本與運(yùn)營開支)加總基本在當(dāng)期收入的10倍上下。Minimax 2025年前九個(gè)月收入快速做大后支出仍然是收入的5倍以上;而智譜到了2025年上半年看起來反而更加規(guī)模不經(jīng)濟(jì)了。
![]()
這里的核心問題是,對(duì)于模型公司而言,到底收入越大、虧損率收窄,還是收入越大、虧損率越高的規(guī)模不經(jīng)濟(jì)結(jié)局?
模型經(jīng)濟(jì)學(xué)的底層三要素——數(shù)據(jù)、算力、算法,大家已耳熟能詳。但要解答模型到底適不適用互聯(lián)網(wǎng)規(guī)模經(jīng)濟(jì)規(guī)模,關(guān)鍵是理解大模型到底需要怎樣的投入密度。
在大語言模型訓(xùn)練中,用了什么訓(xùn)練數(shù)據(jù)從來沒有模型廠真正公開,但這個(gè)問題大致有這么兩個(gè)共識(shí); a.公共語料庫有百科、代碼庫、Common Crawl語料庫等; b.但公共和標(biāo)準(zhǔn)語料庫幾乎已被模型訓(xùn)練完畢。
到了2026年,大模型公司開始依賴合成數(shù)據(jù)和思維連數(shù)據(jù)。但未來,要給模型投喂更多數(shù)據(jù),要么靠自身超快的落地速度去接入更多場景;要么大模型公司本有自有數(shù)據(jù),比如說互聯(lián)網(wǎng)大廠更具數(shù)據(jù)優(yōu)勢(shì);剩下就是比拼對(duì)私有數(shù)據(jù)的付費(fèi)能力。
但數(shù)據(jù)投喂量因涉及數(shù)據(jù)合規(guī)和隱私等,沒有模型廠會(huì)在報(bào)表中展示。真正能體現(xiàn)在報(bào)表端的,主要是算力和算法,算法的精進(jìn)本質(zhì)是靠人,算力對(duì)應(yīng)的是芯片和云服務(wù)。對(duì)于這兩個(gè)問題,我們就一個(gè)一個(gè)來看一下。
二、人太貴了?不是核心問題!
兩個(gè)公司員工整體都沒超1000人,尤其是Minimax都不足400人;兩家公司研發(fā)人員都接近75%,單人頭月成本6.5-8.5萬元人民幣(不含期權(quán)激勵(lì)),其中Minimax研發(fā)人員單人月成本是16萬。
Minimax因人員更為精煉,收入做大過程中,薪資支出至少已能夠收入覆蓋。而智譜因?yàn)樯虡I(yè)變現(xiàn)上主要是to B落地,需要匹配更多銷售人員;而且研發(fā)上對(duì)通用模型著力更高,所以人力成本改善并不明顯。
![]()
其實(shí),從這兩家公司可以看出,大模型在人力上的投入,更多是人才“腦力”密度的投入,而非人力密度的投入。甚至從Minimax的人才密度,可能已經(jīng)預(yù)示了AI時(shí)代互聯(lián)網(wǎng)公司的人力結(jié)構(gòu)雛形:
少而精的大模型研發(fā)人才,大量其他的部門崗位都在被模型取代(Minimax旗下AI產(chǎn)品眾多,但并未對(duì)應(yīng)超大的人頭量),總體薪資呈現(xiàn)出單人薪資超高,但總體可控的狀態(tài)。
比如Minimax一年總薪資支出大約1億美金(大約收入的90%上下),考慮到這兩家公司基座模型的迭代能力和多模態(tài)的發(fā)布速度、海外AI動(dòng)輒上億美金的搶人戰(zhàn)慘烈程度(動(dòng)輒挖一人開出的薪資就上億美金),這樣的人員支出還不算夸張。
三、核心矛盾:創(chuàng)收 vs 投入,到底能有平衡的時(shí)候嗎?
雖然薪資成本基本已經(jīng)把當(dāng)期的收入“吃光了”。相比于算力投入,人力薪資只是小菜一碟。薪資至少可以隨著收入的擴(kuò)張而有效稀釋,但算力投入從兩家目前的情況看下來,是一個(gè)比收入增長斜率更高的投入類型。
而且從報(bào)表上來看,由于Minimax和智譜固定資產(chǎn)開支都非常少,幾乎可以確定,兩家公司的算力都是使用的第三方云服務(wù),這種相對(duì)輕資產(chǎn)的模式,而非OpenAI高度自控?cái)?shù)據(jù)中心的方式。
大模型公司的報(bào)表中,算力的使用都分為了訓(xùn)練算力和推理算力。
模型在訓(xùn)練階段,就等于要做出來一個(gè)可以產(chǎn)生經(jīng)濟(jì)效益的商品和服務(wù),需要做研發(fā)投入,在產(chǎn)品投用(模型進(jìn)入推理場景)之前,對(duì)應(yīng)的模型訓(xùn)練支出,都是推出產(chǎn)品之前的“沉淀支出”,計(jì)入研發(fā)費(fèi)用當(dāng)中。
而研發(fā)好的模型投入了推理使用場景中,產(chǎn)生的收益記為收入,而推理階段模型對(duì)于算力的消耗,就記為收入創(chuàng)造過程中的直接成本,記在成本項(xiàng)當(dāng)中。
背后的邏輯也簡單:大模型公司砸人、砸算力、砸數(shù)據(jù)先在實(shí)驗(yàn)室里做模型的研發(fā),這個(gè)是無論模型是否做出為客戶所用,是模型公司都必須要做“沉淀投入”。
只有當(dāng)模型被研發(fā)出來,可以用到推理環(huán)節(jié),無論是客戶調(diào)用模型接口還是自己直接用模型做出來APP來產(chǎn)生收入,才會(huì)產(chǎn)生推理收入和推理計(jì)算的成本。
這Minimax和智譜兩家公司來看,為了研發(fā)模型,單單訓(xùn)練算力投入全部占到了總支出的50%以上,是開支的絕對(duì)大頭,也是妥妥的“吸金黑洞”,貢獻(xiàn)了兩家公司5-10倍虧損率中的一半以上的支出。
![]()
![]()
這一占比,直接量化了海豚君在《》中所說的算力吸空產(chǎn)業(yè)鏈利潤的說法。
再拿收入創(chuàng)造和模型訓(xùn)練投入相比,就更能直觀感受到訓(xùn)練投入的強(qiáng)度了:
從Minimax來看,2024年創(chuàng)收只有23年模型訓(xùn)練算力投入的65%,25年前三季度雖然收入成長很快,但也對(duì)24年同期訓(xùn)練算力成本覆蓋能力反而進(jìn)一步降低到了50%;智譜到25年上半年更是僅有30%的覆蓋率。
Minimax由于產(chǎn)品落地上,以海外to C情感AI陪聊為主,設(shè)計(jì)上有很多游戲和互聯(lián)網(wǎng)增值的變現(xiàn)模式(詳細(xì)產(chǎn)品和商業(yè)化落地會(huì)另外詳細(xì)分析),to C的互聯(lián)網(wǎng)規(guī)模效應(yīng)+海外付費(fèi)能力較強(qiáng),收入對(duì)訓(xùn)練成本情況壓力尚小一些。
但智譜的情況就是一個(gè)非常明顯的收入高增,但對(duì)訓(xùn)練成本的回收能力,因?yàn)橛?xùn)練成本增長斜率更高,反而越來越弱。
![]()
這兩年趨勢(shì)看,雖然兩家作為中國獨(dú)立模型公司的佼佼者,收入增長斜率都很高,但當(dāng)年創(chuàng)收對(duì)上一年研發(fā)投入的代償全都不盡如人意。
這兩年趨勢(shì)看,雖然兩家作為中國獨(dú)立模型公司的佼佼者,收入增長斜率都很高,但當(dāng)年創(chuàng)收對(duì)上一年研發(fā)投入的代償全都不盡如人意。
模型要優(yōu)秀,訓(xùn)練成本就越高;收入跑得再快,也跟不上一代更比一代高的模型投入。那么矛盾來了,模型越做越虧,這種生意如何理解商業(yè)價(jià)值?
四、大模型到底是怎樣的商業(yè)模式?
大模型動(dòng)輒1000%的虧損率,再次形象地說明了它的研發(fā)是一個(gè)人才+算力+數(shù)據(jù)三重密集的商業(yè)模式。
強(qiáng)投入和快迭代的共振,在海豚君看來,本質(zhì)上是把一個(gè)強(qiáng)資產(chǎn)負(fù)債表的資金密集性業(yè)務(wù),做成了“全長在”利潤表上的生意。
而當(dāng)它具備長期的經(jīng)濟(jì)和商業(yè)價(jià)值的時(shí)候,就是模型回歸成真正的“資產(chǎn)負(fù)債表”業(yè)務(wù)——模型不再需要年年投,而是投一年的訓(xùn)練成本可管之后10年甚至20年,讓模型持續(xù)產(chǎn)生收入。這個(gè)時(shí)候,訓(xùn)練成本可以做長期攤銷的時(shí)候,也只有這樣,模型研發(fā)的訓(xùn)練成本才會(huì)有研發(fā)資本化的真正商業(yè)基礎(chǔ)。具體來看:
1)算力:節(jié)節(jié)高的“固定資產(chǎn)投入”
Minimax和智譜為例,23年研發(fā)一代模型,訓(xùn)練成本要四、五千萬美金之間; 而下一代模型的訓(xùn)練要實(shí)現(xiàn)代際的線性差異,在數(shù)據(jù)量、模型參數(shù)量和算力投入反而是指數(shù)級(jí)的提升。最終算力效率提升,反而拉高了算力的總需求量。
從這兩家公司來看,模型升級(jí)一代,訓(xùn)練成本基本要提高3-5倍。
![]()
當(dāng)下大模型的競爭節(jié)奏,基本都是一年出一代模型。也就是說之前一年訓(xùn)練出的模型,只對(duì)應(yīng)接下來一年的推理創(chuàng)收期。
這么高的算力投入,沒有辦法做攤銷折舊,只能全部計(jì)入當(dāng)期的研發(fā)費(fèi)用當(dāng)中,結(jié)果就是上文高于收入5-10倍的虧損這種 “慘不忍睹”的虧損率。
2)快迭代:收入vs 投入,追不上的“貓鼠游戲”?
智譜和Minimax兩家公司面臨的共同情況都是,模型的創(chuàng)收能力尚且覆蓋無法模型的算力投入。雖然收入跑不過訓(xùn)練成本,一邊狂虧一邊狂投,幾乎是研發(fā)大模型必然的宿命。
為了讓自己活到黎明時(shí)刻,公司要把這代模型的創(chuàng)收,再考慮上研發(fā)薪資支出,幾乎要再貼上高于收入3-5倍的融資資金,才能為下一代的模型研發(fā)續(xù)命,以保證模型不被市場淘汰。
而這樣一直滾雪球下去,就是一個(gè)收入一直追不上未來投入;且只要還在大模型競爭的牌桌上,就需要不斷融資,而且越做大、融資窟窿越大的“資本比拼”游戲。
![]()
3)縮放定律失效:資本游戲結(jié)束?
一個(gè)自然而然的問題是,這么下去,到底什么時(shí)間才是個(gè)頭?很顯然,在成本端投入巨大的情況下,這里矛盾的核心已不是簡單的收入成長速度能否匹配訓(xùn)練成本增速的問題,更加重要的問題是,什么時(shí)間模型不需要這么大的投入,或者迭代速度不需要這么快了。
對(duì)于大模型技術(shù)本身而言,不需要投入的時(shí)候,其實(shí)就是縮放定律(scaling law)失效的時(shí)候,換句話說,當(dāng)增加一點(diǎn)點(diǎn)的智力所需要的算力開始暴漲式上升的時(shí)候,模型訓(xùn)練的必要性就不大了。
模型不再需要高頻的訓(xùn)練來迭代,也意味著高密集的訓(xùn)練重資產(chǎn)投入告一段落。算力投入一代新模型后,這代模型能有10年甚至更長的時(shí)間來創(chuàng)收。甚至當(dāng)模型不再需要訓(xùn)練投入,但大模型能夠一直創(chuàng)收,這時(shí)一個(gè)類似“長江電力”的商業(yè)模式也就呼之欲出了。
但這個(gè)假設(shè)的基本前提是,頭部大模型廠商在長期的資本、人力和數(shù)據(jù)消耗戰(zhàn)中,已經(jīng)熬死了一眾對(duì)手,僅剩的幾個(gè)對(duì)手之間達(dá)成默契,不再打價(jià)格戰(zhàn),最終形成類似當(dāng)下云服務(wù)市場一樣、市占率高度集中的寡頭市場,那么大模型的商業(yè)模式自然也就立住了。
4)終局之前,是殘酷的資本游戲
但縮放定律失效時(shí)刻到來之前,大模型公司會(huì)是持續(xù)的吞金獸。這種情況下,商業(yè)模式的競爭本質(zhì)上就變成了一場持續(xù)融資的資本競賽。
當(dāng)然,如果像蔚來一樣,真有大模型公司能把融資做成一種差異化的生存能力,確實(shí)也是一項(xiàng)核心技能。但對(duì)于大多數(shù)公司而言,融資不是博傻游戲,資金愿意融資,本身是要看企業(yè)的產(chǎn)品和執(zhí)行能力,能融到資金,而且估值越來越高,本身也是一個(gè)雙向選擇的過程。
按媒體報(bào)道,中國的模型之戰(zhàn),也已經(jīng)從剛開始的百模之戰(zhàn)走到基模五強(qiáng)——字節(jié)、阿里、階躍、智譜和DeepSeek。
原本的模型創(chuàng)業(yè)“六小龍”階躍、智譜、MiniMax、百川智能、月之暗面與零一萬物中,在DeepSeek一夜爆紅并用完全的開源顛覆了模型收費(fèi)之后,零一萬物和百川智能已經(jīng)掉隊(duì)。
海外同樣也已經(jīng)變成五虎爭霸:OpenAI、Anthropic、谷歌Gemini、xAI和 Meta Llama,甚至Meta的模型也已經(jīng)落后。
一些能夠持續(xù)融資且估值能夠水漲船高、有一些在快速的死在了半路上。從大模型生存的路徑來看,融資能力背后真正的是核心人才、模型實(shí)力和產(chǎn)品落地進(jìn)度能力綜合作用的結(jié)果。
核心人才是AI的上億美金搶人大賽,這個(gè)還是持續(xù)進(jìn)行中,而另外兩個(gè)一個(gè)看模型本身智能化程度,而另外一個(gè)最終要落地到創(chuàng)收能力上。
1)模型實(shí)力:
從下文可以看到,模型創(chuàng)業(yè)公司能生存下來,大多在模型的榜單上能找得到名字,這背后是模型在各個(gè)細(xì)分顆粒度上(模型智能化程度、幻覺率、模型參數(shù)、回答時(shí)首個(gè)Token輸出前的等待時(shí)長等)的競爭相對(duì)靠前。
![]()
2)產(chǎn)品落地能力
過去一年中,多數(shù)獨(dú)立創(chuàng)業(yè)公司,要么在與互聯(lián)網(wǎng)大廠競爭中被挖走了人,要么產(chǎn)品落地上創(chuàng)收困難,要么是模型價(jià)格比拼中,干不過性價(jià)比高的開源模型,模型隱沒在了半路上。
![]()
如果用一句話來概括的話,在Scaling Law撞墻的“黎明時(shí)分”之前,甚至到來之后的一段時(shí)間內(nèi),我們都會(huì)看到一個(gè)個(gè)模型在“人才搶奪、模型研發(fā)和產(chǎn)品落地”三維度的比拼中,一個(gè)個(gè)倒下去。
而真正能走向決賽的,除了看人和背后的資金實(shí)力,更加重要的是看模型研發(fā)的進(jìn)度和產(chǎn)品落地的水平。
下一篇分析,海豚君就會(huì)圍繞智譜和Minimax的模型和產(chǎn)品落地,來理解如何去評(píng)價(jià)大模型的資本市場價(jià)值。
//轉(zhuǎn)載開白
本文為海豚研究原創(chuàng)文章,如需轉(zhuǎn)載請(qǐng)?zhí)砑游⑿牛篸olphinR124 獲得開白授權(quán)。
//免責(zé)聲明及一般披露提示
本報(bào)告僅作一般綜合數(shù)據(jù)之用,旨在海豚研究及其關(guān)聯(lián)機(jī)構(gòu)之用戶作一般閱覽及數(shù)據(jù)參考,並未考慮接獲本報(bào)告之任何人士之特定投資目標(biāo)、投資產(chǎn)品偏好、風(fēng)險(xiǎn)承受能力、財(cái)務(wù)狀況及特別需求投資者若基於此報(bào)告做出投資前,必須諮詢獨(dú)立專業(yè)顧問的意見。任何因使用或參考本報(bào)告提及內(nèi)容或信息做出投資決策的人士,需自行承擔(dān)風(fēng)險(xiǎn)。海豚研究毋須承擔(dān)因使用本報(bào)告所載數(shù)據(jù)而可能直接或間接引致之任何責(zé)任或損失。本報(bào)告所載信息及數(shù)據(jù)基於已公開的資料,僅作參考用途,海豚研究力求但不保證相關(guān)信息及數(shù)據(jù)的可靠性、準(zhǔn)確性和完整性。
本報(bào)告中所提及之信息或所表達(dá)之觀點(diǎn),在任何司法管轄權(quán)下的地方均不可被作為或被視作證券出售邀約或證券買賣之邀請(qǐng),也不構(gòu)成對(duì)有關(guān)證券或相關(guān)金融工具的建議、詢價(jià)及推薦等。本報(bào)告所載資訊、工具及資料並非用作或擬作分派予在分派、刊發(fā)、提供或使用有關(guān)資訊、工具及資料抵觸適用法例或規(guī)例之司法權(quán)區(qū)或?qū)е潞k嘌芯考埃蚱涓綄俟净蚵?lián)屬公司須遵守該司法權(quán)區(qū)之任何註冊(cè)或申領(lǐng)牌照規(guī)定的有關(guān)司法權(quán)區(qū)的公民或居民。
本報(bào)告僅反映相關(guān)創(chuàng)作人員個(gè)人的觀點(diǎn)、見解及分析方法,並不代表海豚研究及/或其關(guān)聯(lián)機(jī)構(gòu)的立場。
本報(bào)告由海豚研究製作,版權(quán)僅為海豚研究所有。任何機(jī)構(gòu)或個(gè)人未經(jīng)海豚研究事先書面同意的情況下,均不得(i)以任何方式製作、拷貝、複製、翻版、轉(zhuǎn)發(fā)等任何形式的複印件或複製品,及/或(ii)直接或間接再次分發(fā)或轉(zhuǎn)交予其他非授權(quán)人士,海豚研究將保留一切相關(guān)權(quán)利。
![]()
文章不易,點(diǎn)個(gè)“分享”,給我充點(diǎn)兒電吧~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.