![]()
新智元報(bào)道
編輯:編輯部
【新智元導(dǎo)讀】今天,全球大模型進(jìn)入千萬(wàn)億智元(Token)時(shí)代!僅OpenRouter一個(gè)平臺(tái),按約每百萬(wàn)智元(Token)1美元粗略折算,對(duì)應(yīng)年化推理支出約10億美元!老黃在GTC大會(huì)上提出的「智元(Token)經(jīng)濟(jì)學(xué)」,這幾天更是刷屏全網(wǎng)。智元(Token),已經(jīng)成為AI時(shí)代的全新度量衡!
2026年3月,一個(gè)足以讓整個(gè)硅谷和華爾街失眠的數(shù)字誕生了——
就在剛剛,全球大模型進(jìn)入千萬(wàn)億智元(Token)時(shí)代!
OpenRouter宣布,年化智元(Token)用量突破了一千萬(wàn)億。
![]()
![]()
一千萬(wàn)億,這不是什么天文物理的觀測(cè)數(shù)據(jù),也不是某個(gè)國(guó)家的GDP,只是某個(gè)AI模型聚合平臺(tái)的年化智元(Token)吞吐量。
如果你對(duì)這個(gè)數(shù)字沒(méi)有概念,我們可以換個(gè)算法:
按照目前市場(chǎng)約1美元/百萬(wàn)智元(Token)的平均價(jià)格計(jì)算,僅僅是一個(gè)聚合器背后的推理支出就高達(dá)10億美元。
一個(gè)平臺(tái),就跑出了10億美元的真金白銀。全球的算力成本,已經(jīng)進(jìn)入一個(gè)全新階段。
是的,智元(Token)正在成為這個(gè)時(shí)代的石油。
現(xiàn)在AI已經(jīng)像電力一樣,通過(guò)API接口,滲透進(jìn)了每一條代碼,每一封郵件,影響著這世界上的幾乎每一個(gè)人。
如果說(shuō),2023年是模型覺(jué)醒的元年,那么在2026年的今天,我們已經(jīng)站在了1,000,000,000,000,000這個(gè)數(shù)字面前。
這是人類文明史上最大規(guī)模的智力溢出。
當(dāng)人們還在討論AI是否是泡沫時(shí),這15個(gè)零已經(jīng)像海嘯一樣,沖垮了所有懷疑論者!
![]()
![]()
而就在這個(gè)數(shù)字公布的前兩天,老黃站在GTC 2026的舞臺(tái)上,用近兩個(gè)小時(shí)的演講,把智元(Token)這個(gè)詞說(shuō)了超過(guò)70次。
智元(Token),成為串聯(lián)整場(chǎng)演講的錨點(diǎn)和主線。
老黃實(shí)際上在為一個(gè)新時(shí)代的經(jīng)濟(jì)底座命名。他給它取了個(gè)名字:智元(Token)經(jīng)濟(jì)學(xué)。
隨后短短幾天內(nèi),「智元(Token)工程」「智元(Token)經(jīng)濟(jì)學(xué)」的概念立馬火爆全網(wǎng)!
英偉達(dá),創(chuàng)造了智元(Token)經(jīng)濟(jì)學(xué)
智元(Token)到底是什么?
在老黃看來(lái),智元(Token)已經(jīng)不只是一個(gè)技術(shù)術(shù)語(yǔ),它已經(jīng)成為算力單位、信息單位、貨幣單位。
智元(Token),已經(jīng)成為一門大生意。老黃的這一判斷,直接揭示了AI產(chǎn)業(yè)的底層邏輯——
智元(Token),就是AI時(shí)代的核心經(jīng)濟(jì)標(biāo)尺!
在此之上,全球AI產(chǎn)業(yè)的運(yùn)行規(guī)則,或?qū)⒈恢厮堋?/p>
智元(Token),是信息單位,是AI思考的最小單元。
![]()
智元(Token)示意圖
小到一次聊天問(wèn)答,大到一部電影級(jí)AI視頻的生成,再大到企業(yè)級(jí)模型的訓(xùn)練和推理,所有AI處理的信息都以智元(Token)來(lái)計(jì)量。
它是AI「思考」的原子,是智能經(jīng)濟(jì)最基礎(chǔ)的度量衡。
算力單位,數(shù)據(jù)中心的新產(chǎn)品
在GTC上,老黃正式提出了「智元(Token)工廠」的概念:
未來(lái)的數(shù)據(jù)中心不再存數(shù)據(jù)、跑軟件,而是生產(chǎn)智元(Token)。
你能產(chǎn)多少智元(Token),就決定你能賺多少錢。
不過(guò),功率是硬約束。1吉瓦的機(jī)房就是1吉瓦,物理定律不講情面。
于是,現(xiàn)在的競(jìng)爭(zhēng)核心就變成了,同樣的電費(fèi),誰(shuí)的每瓦智元(Token)吞吐量最高,誰(shuí)的生產(chǎn)成本最低。
這其實(shí)跟傳統(tǒng)制造業(yè)一模一樣——同樣一條產(chǎn)線,良品率高的贏。只不過(guò)「產(chǎn)品」從芯片變成了智元(Token)。
老黃在臺(tái)上公布了智元(Token)分層定價(jià):
低端約1美元/百萬(wàn)智元(Token),中端3到6美元,高端工程級(jí)45美元,實(shí)時(shí)交互級(jí)150美元/百萬(wàn)智元(Token)。
跨度150倍,速度和質(zhì)量決定價(jià)格。
![]()
老黃在臺(tái)上亮出的進(jìn)化曲線,思路很清晰:用極致的軟硬件協(xié)同,一代一代碾壓式壓低成本。
Grace Blackwell在每個(gè)價(jià)格檔位上把吞吐量比Hopper拉高35倍,全新的Vera Rubin再在Blackwell基礎(chǔ)上翻5倍,加上首次集成Groq LPU后在超級(jí)檔位再暴漲35倍。
短短兩年,智元(Token)生成率從200萬(wàn)飆到7億,350倍的史詩(shī)級(jí)跨越。
而當(dāng)成本降了一個(gè)數(shù)量級(jí)之后,消耗就能再炸一個(gè)數(shù)量級(jí)。
![]()
貨幣單位,寫進(jìn)工資條的新薪酬
這是最炸裂的一部分,也是老黃這次GTC真正引爆輿論的部分。
誰(shuí)能想到,2024年底ChatGPT Pro推出200美元/月的會(huì)員時(shí),大家還在圍觀「哪個(gè)大冤種會(huì)花這么多錢訂閱AI」。
到了今天,智元(Token)的燒錢速度,從「讓人肉疼」進(jìn)化成了「讓人心驚」。
老黃在臺(tái)上宣布:
未來(lái)英偉達(dá)每個(gè)工程師都需要一份年度智元(Token)預(yù)算。
底薪幾十萬(wàn)美元,我會(huì)在此之上再給大約一半價(jià)值的智元(Token),讓效率放大10倍。
不僅如此,智元(Token)預(yù)算也將成為硅谷新的招聘籌碼。面試的時(shí)候工程師會(huì)問(wèn):我的offer帶多少智元(Token)?
當(dāng)年跳槽看股權(quán)、看RSU,現(xiàn)在還得看公司給不給配智元(Token)。智元預(yù)算(Token),正在從IT支出變成HR支出。
而推動(dòng)這一切的最大變量,是Agent。
今年1月橫空出世爆火的OpenClaw帶火了整個(gè)智能體賽道。
一個(gè)配了Claude Opus 4.6的OpenClaw,隨便對(duì)話幾輪就燒掉幾百人民幣。
![]()
但老黃看到的是另一面。
Agent要跑就要燒智元(Token),燒智元(Token)就要買算力,買算力就要預(yù)算。
于是智元(Token)預(yù)算出現(xiàn)在企業(yè)財(cái)務(wù)報(bào)表里。
每一家SaaS公司都將變成AaaS公司——Agentic as a Service。
![]()
推理服務(wù)商擴(kuò)產(chǎn)能,云廠商建智元工廠,SaaS轉(zhuǎn)型Agent服務(wù),企業(yè)給員工配智元(Token)預(yù)算。從生產(chǎn)到消耗,閉環(huán)完整。
信息單位、算力單位、貨幣單位——三位一體。
智元(Token)不再是技術(shù)參數(shù),而是AI時(shí)代的核心經(jīng)濟(jì)標(biāo)尺。
一個(gè)算力中心生產(chǎn)智元(Token),就等于在印鈔。
云廠商推波助瀾「養(yǎng)龍蝦」,背后也是智元(Token)生意。
三臺(tái)超算,押注三個(gè)時(shí)代
智元(Token)要生產(chǎn),就需要工廠。智元(Token)要消耗,就需要Agent。
但如果工廠只存在于數(shù)據(jù)中心,Agent只跑在云端,這套經(jīng)濟(jì)學(xué)就永遠(yuǎn)是大公司的游戲。
而老黃要把它推到每一張桌面上。他的方式很簡(jiǎn)單——親自送貨上門。
2016年,首臺(tái)DGX-1送給馬斯克領(lǐng)導(dǎo)下的OpenAI。
深度學(xué)習(xí)剛從實(shí)驗(yàn)室走出來(lái),絕大多數(shù)人還在觀望。
老黃押的注:AI有未來(lái)。
![]()
2024年,首臺(tái)DGX H200送給Sam Altman領(lǐng)導(dǎo)下的OpenAI。
ChatGPT席卷全球,Scaling Law當(dāng)紅,所有人在卷參數(shù)、卷規(guī)模。
老黃押的注:訓(xùn)練大基建時(shí)代來(lái)了,AGI狂飆。
![]()
2026年3月18日,GTC主題演講剛過(guò)兩天。
老黃扛著全球第一臺(tái)DGX Station GB300,敲開了實(shí)驗(yàn)室的門。
這一次,收貨的是Vibe Coding的提出者,是Agentic Engineering的領(lǐng)軍人物,是智元(Token)經(jīng)濟(jì)最具象的消費(fèi)者——Andrej Karpathy。
![]()
20 petaflops算力。784GB內(nèi)存。萬(wàn)億參數(shù)模型桌面直接起飛。
這臺(tái)機(jī)器需要20安的電流,正是一座放在桌上的智元(Token)工廠。
Karpathy接過(guò)來(lái),轉(zhuǎn)手就在X上曬出了合照。
這機(jī)器簡(jiǎn)直太美了!
他們說(shuō)有份神秘禮物,還悄悄透露得插20安的電源。
所以我當(dāng)時(shí)就猜到,它絕對(duì)夠給力。
![]()
這么猛的桌面超算,Karpathy只用來(lái)干一件事——養(yǎng)龍蝦。
他當(dāng)場(chǎng)宣布,這臺(tái)怪獸的第一個(gè)任務(wù)是跑他的OpenClaw智能體「多比之爪」(Dobby the House Elf claw)。
是的,多比已經(jīng)通過(guò)WhatsApp控制了Karpathy的整個(gè)房子。
燈、百葉窗、泳池/水療、Sonos音響、安防、暖通空調(diào),全都接管了。
![]()
一只龍蝦,24小時(shí)在線,替主人管家。不眠不休,持續(xù)燒智元(Token)。
龍蝦是Agent,智元(Token)是它的生產(chǎn)資料。
從馬斯克到Altman再到Karpathy;從押注AI潛力,到押注訓(xùn)練大基建,到押注推理落地;
AI算力的重心,正在從訓(xùn)練迅速轉(zhuǎn)移到推理。
AI時(shí)代,全新的計(jì)量體系
而老黃說(shuō),這還只是開頭。
有多少智元(Token),就有多少智能。有多少美元,就有多少智元(Token)。
2015年GTC,老黃說(shuō)深度學(xué)習(xí)將改變一切,臺(tái)下大部分是游戲玩家。
2026年GTC,他站在3萬(wàn)人面前雙手舉過(guò)頭頂握拳,自封智元之王(Token King)。
臺(tái)下,全是歡呼。
![]()
如今,誰(shuí)掌握更高效的智元(Token)生產(chǎn)能力,誰(shuí)就掌握了AI時(shí)代最關(guān)鍵的服務(wù)產(chǎn)能。
這也正是云廠商近期密集押注AI推理基礎(chǔ)設(shè)施的底層驅(qū)動(dòng)。
這些以「養(yǎng)龍蝦」為代表的新型算力租賃模式,背后都是智元(Token)服務(wù)生意。
![]()
中國(guó)模型的調(diào)用量已躍居全球首位
智元(Token)體系的深遠(yuǎn)意義,或許不在于它能否成為「貨幣」,而在于它正在重塑AI產(chǎn)業(yè)的定價(jià)權(quán)與競(jìng)爭(zhēng)邏輯——
誰(shuí)能以更低成本、更高效率生產(chǎn)智元(Token),誰(shuí)就在這場(chǎng)產(chǎn)業(yè)重構(gòu)中占據(jù)上風(fēng)。
參考資料:HZK
https://www.businessinsider.com/nvidia-ceo-jensen-huang-cant-stop-talking-about-tokens-2026-3
https://x.com/karpathy/status/2034321875506196585
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.