![]()
隨著Openclaw的大火,大家在養(yǎng)蝦之余最大的痛點(diǎn),無(wú)疑于Token用起來(lái)太快 、太貴,各種“龍蝦”操縱傾家蕩產(chǎn)續(xù)費(fèi)Token的段子。
大家肉痛的同時(shí),有沒(méi)有想過(guò),各家廠商在這里面能賺多少呢?部署個(gè)大模型賣(mài)算力會(huì)是個(gè)好生意么?
今天我們就來(lái)一起深度測(cè)算一下:
各大廠商Token收費(fèi)幾何?
我們統(tǒng)計(jì)了截至2026 年 3 月,國(guó)內(nèi)外主流大模型 API 的Token收費(fèi)標(biāo)準(zhǔn)(按百萬(wàn)Token 計(jì)費(fèi),單位:美元 / 人民幣):
一、國(guó)外主流大模型(美元/ 百萬(wàn) Token)
1. OpenAI(2026-03-06 最新)
![]()
2. Anthropic Claude(2026-03)
![]()
3. Google Gemini(2026)
![]()
二、國(guó)內(nèi)主流大模型(元/ 百萬(wàn) Token)
1. 百度文心一言
![]()
2. 阿里通義千問(wèn)
![]()
3. 騰訊混元
![]()
4. 字節(jié)豆包
![]()
三、價(jià)格對(duì)比要點(diǎn)
1、國(guó)內(nèi)vs國(guó)外:國(guó)內(nèi)模型價(jià)格普遍為海外頂尖模型的1/5~1/20,中文場(chǎng)景性價(jià)比更高。
2、輸入vs輸出:輸出Token價(jià)格通常是輸入的4~8倍,長(zhǎng)文本生成成本更高。
3、緩存機(jī)制:主流模型支持上下文緩存,緩存輸入價(jià)格可低至標(biāo)準(zhǔn)輸入的1/10,適合長(zhǎng)文檔/對(duì)話場(chǎng)景。
4、長(zhǎng)上下文溢價(jià):超過(guò)基礎(chǔ)窗口(如200K)后,價(jià)格常翻倍。
賣(mài)算力token成本如何,利潤(rùn)多少?
撇除人工研發(fā)費(fèi)用,算力成本的核心是電力成本和硬件折舊。
一、先統(tǒng)一假設(shè)(最保守、最貼近真實(shí))
·模型:通義千問(wèn)Turbo / DeepSeek-chat(V3.2)(國(guó)內(nèi)最低定價(jià))
·硬件:H800 8卡服務(wù)器(當(dāng)前主流推理硬件)
單卡:700W(滿載)
整機(jī):8×700W = 5.6kW
PUE:1.3(含冷卻)→實(shí)際用電:5.6×1.3 = 7.28kW
·電價(jià):0.3元/度(國(guó)內(nèi)西部綠電/工業(yè)電價(jià),保守取中)
·服務(wù)器成本:?jiǎn)闻_(tái)200萬(wàn)元(8×H800)
·折舊:3年直線折舊→年折舊:200萬(wàn)÷ 3 ≈ 66.67萬(wàn)元
·利用率:70%(推理集群典型滿載率)
·推理效率:?jiǎn)蜨800每秒生成60 tokens(DeepSeek實(shí)測(cè))
單卡日產(chǎn)出:60 × 3600 × 24 × 0.7 ≈ 362.88萬(wàn)tokens /天
整機(jī)(8卡)日產(chǎn)出:≈ 2903萬(wàn)tokens /天
整機(jī)年產(chǎn)出:≈ 105.96億tokens = 1,059,600百萬(wàn)tokens
二、直接成本測(cè)算(每百萬(wàn)Token)
1. 電力成本(每百萬(wàn) Token)
·整機(jī)每小時(shí)耗電:7.28度
·整機(jī)每小時(shí)產(chǎn)出:60×3600×8×0.7 ≈ 120.96萬(wàn)tokens
·每百萬(wàn)Token耗電:7.28 ÷ 120.96 ≈ 0.0602度
·電力成本:0.0602 × 0.3 ≈ 0.018元/百萬(wàn)Token
2. 服務(wù)器折舊成本(每百萬(wàn) Token)
·年折舊:666,700元
·年產(chǎn)出:1,059,600百萬(wàn)tokens
·折舊成本:666,700 ÷ 1,059,600 ≈ 0.629元/百萬(wàn)Token
3. 直接總成本(電力 + 折舊)
·≈ 0.018 + 0.629 = 0.647元/百萬(wàn)Token
三、下面我們以四家模型為例:收入/ 成本 / 毛利率
1. 通義千問(wèn) Turbo(國(guó)內(nèi)最便宜)
·輸入:0.3元/百萬(wàn)
·輸出:0.6元/百萬(wàn)
·收入:0.3 + 2×0.6 =1.5元
·成本:0.65元
·毛利率:≈ 57%
2. DeepSeek Chat
·輸入:2.0元
·輸出:3.0元
·收入:2.0 + 2×3.0 =8.0元
·成本:0.65元
·毛利率:≈ 92%
3. 豆包 Doubao Seed 2.0 Pro
·輸入:3.2元/百萬(wàn)
·輸出:16.0元/百萬(wàn)
·收入:3.2 + 2×16.0 =35.2元
·成本:0.65元
·毛利率:≈ 98%
4. OpenAI GPT-5.4
·輸入:18元
·輸出:108元
·收入:18 + 2×108 =234元
·成本:0.65元
·毛利率:≈ 99.7%
![]()
我們可以得出:
1、哪怕國(guó)內(nèi)最便宜的模型,定價(jià)也遠(yuǎn)超硬件+電費(fèi)成本。
2、電力幾乎可以忽略不計(jì),成本只有GPU折舊。
3、所有大模型API都是高毛利生意,低價(jià)只是卷市場(chǎng),不是不賺錢(qián)。
4、GPT定價(jià)是國(guó)內(nèi)的30~100倍,成本幾乎一樣。
毛利潤(rùn)由此可見(jiàn),大廠猛推龍蝦的核心動(dòng)力除了搶占用戶,也確實(shí)賺錢(qián)啊。這還沒(méi)算安裝費(fèi)、云服務(wù)費(fèi)用,在不遠(yuǎn)的將來(lái),賣(mài)算力也許真的是個(gè)好生意。
需要再次強(qiáng)調(diào),本次計(jì)算是刨除了人力成本,AI涌動(dòng),大廠的研發(fā)人員也是一筆巨大開(kāi)支。
免責(zé)聲明:所有算法均為筆者驅(qū)使AI估算,如果你覺(jué)得不對(duì),請(qǐng)盡情在評(píng)論里diss,我?guī)湍銈冋{(diào)教這個(gè)AI。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.