【億邦原創(chuàng)】近期,全球科技圈的目光都聚焦在圣何塞。黃仁勛穿著那件標(biāo)志性的皮夾克走上GTC舞臺,兩個(gè)小時(shí)的演講,照例發(fā)布了更快的GPU、更大的集群、更激進(jìn)的路線圖。但這一次,真正讓人心頭一震的,不是某款芯片的算力數(shù)字,而是他反復(fù)提及的一個(gè)詞:Token。
“Token的時(shí)代到了。”這句話像一顆石子投入湖面,漣漪迅速擴(kuò)散到每一個(gè)關(guān)心AI未來的人心中。
Token是什么?它為什么被賦予如此重要的地位?這場演講背后藏著怎樣的產(chǎn)業(yè)變局?
帶著這些疑問,我圍觀了盛景嘉成的一次GTC圓桌,試圖從黃仁勛那場兩個(gè)多小時(shí)的演講中,打撈那些藏在海量信息下的真金。
一、Token的獨(dú)立宣言
黃仁勛的主題演講,表面上看依然是熟悉的配方:新的GPU架構(gòu)、更快的互聯(lián)技術(shù)、更強(qiáng)大的算力集群。但三位嘉賓的對話讓我意識到,真正值得關(guān)注的看點(diǎn),藏在這些發(fā)布背后的敘事轉(zhuǎn)變里。
看點(diǎn)一:從“每美元Token”到“每焦耳Token”。
芯動(dòng)科技首席科學(xué)家羅彤最先點(diǎn)出這個(gè)轉(zhuǎn)變。黃仁勛在演講中反復(fù)強(qiáng)調(diào)的,不再是芯片的算力峰值,而是“每個(gè)焦耳能產(chǎn)生多少Token”。
當(dāng)計(jì)算量還停留在相對小的規(guī)模時(shí),沒人關(guān)心一次運(yùn)算消耗多少能量。當(dāng)大模型把復(fù)雜問題解構(gòu)成海量數(shù)據(jù),用算力暴力求解時(shí),物理學(xué)的限制開始顯形。
摩爾定律曾是那個(gè)維系平衡的隱形之手。每18個(gè)月,芯片性能翻倍,能耗卻在下降。這條走了50年的路,走到了盡頭。
“摩爾定律的消失,是理解一切變化的主線。”羅彤強(qiáng)調(diào)。當(dāng)芯片無法再縮小,單位算力的能耗不再下降,需求的指數(shù)增長就直接轉(zhuǎn)化為能源消耗的指數(shù)增長。
這便是摩爾定律消亡后的芯片行業(yè):在供應(yīng)端,芯片無法再通過制程微縮來無限降低功耗;在需求端,數(shù)據(jù)依然在以每三年翻一倍的速度增長。能源就成了唯一的硬約束,這是是物理學(xué)的邊界,也是地球真正能承受的上限。
“金錢是人類發(fā)明的概念,自然界不認(rèn)。但能源是物理學(xué)的邊界條件。地球作為一個(gè)生態(tài)系統(tǒng),每天能承受的能量輸入是有上限的。一旦超出,就可能陷入正反饋循環(huán),最終崩潰。”羅彤總結(jié)。
這就是為什么曾經(jīng)只談FLOPS和帶寬的GTC,開始大談特談能源。
看點(diǎn)二:Token成為封裝一切的新通貨。
魔形智能CEO徐凌杰在圓桌中反復(fù)提到一個(gè)詞:封裝。
黃仁勛說的Token,不是技術(shù)意義上的文本碎片,背后是黃仁勛提出的“五層蛋糕”,從下到上依次為:能源、芯片(包括GPU、HBM內(nèi)存、互聯(lián)芯片等硬件)、基礎(chǔ)設(shè)施(涵蓋物理層面的機(jī)房、液冷、供電系統(tǒng),以及廣義層面的算力集群、互聯(lián)架構(gòu)、推理引擎等)、模型(包括開源模型和閉源模型)、應(yīng)用。
黃仁勛認(rèn)為,未來的AI產(chǎn)業(yè)不再是層層割裂的,而是需要把下面四層(能源、芯片、基礎(chǔ)設(shè)施、模型)全部封裝在一起,以一個(gè)統(tǒng)一的輸出單位交付給上層的應(yīng)用。而這個(gè)輸出單位,就是Token。
黃仁勛明確說,Token會(huì)有免費(fèi)版、基礎(chǔ)版、高級版,甚至專門用于高難度推理的“凹槽版”。不同層級的Token對應(yīng)不同的價(jià)格,也對應(yīng)不同的智力和服務(wù)。“這其實(shí)是在構(gòu)建一個(gè)新的經(jīng)濟(jì)學(xué)模型。”徐凌杰認(rèn)為。
這意味著,企業(yè)的成本結(jié)構(gòu)里,除了人力成本,還會(huì)多出一項(xiàng)“Token預(yù)算”。原來我們?yōu)槿肆Ω顿M(fèi),用工資買人的智力;未來,我們還要為智力付費(fèi),用Token買AI的能力。
盛景嘉成創(chuàng)投創(chuàng)始合伙人劉昊飛從另一個(gè)角度理解了Token經(jīng)濟(jì)學(xué)的深意:“黃仁勛在構(gòu)建一個(gè)敘事。從CUDA到Token,再到生態(tài),最后落回‘AI工廠’這個(gè)概念。什么叫工廠?就是可以大規(guī)模、標(biāo)準(zhǔn)化地制造和輸出。他把AI工廠化,把Token商品化,實(shí)際上是在搶占一個(gè)心智定位:未來任何需要智能的地方,都需要Token;任何Token,都離不開英偉達(dá)。”
看點(diǎn)三:超節(jié)點(diǎn)從概念走向量產(chǎn)。
兩年前的GTC,黃仁勛發(fā)布了NVLink 72,開啟了超節(jié)點(diǎn)時(shí)代。但那時(shí)候的超節(jié)點(diǎn)更像一個(gè)實(shí)驗(yàn)室產(chǎn)物——安裝一臺需要兩小時(shí),滿眼的飛線,復(fù)雜的液冷管,機(jī)器穩(wěn)定性的噩夢。
而今年,黃仁勛展示的Rubin機(jī)柜已經(jīng)完全無纜化,100%液冷,幾分鐘就能完成組裝。徐凌杰感慨,技術(shù)迭代的速度遠(yuǎn)超想象。
今年CES展,AMD也曾展示“超節(jié)點(diǎn)”,和英偉達(dá)兩年前的設(shè)計(jì)如出一轍——滿屏飛線。“這說明兩件事:第一,超節(jié)點(diǎn)確實(shí)是方向,大家都在跟進(jìn);第二,它真的很難做。”徐凌杰說。
二、對中國算力產(chǎn)業(yè)鏈的啟發(fā)
當(dāng)我們把目光從GTC現(xiàn)場收回國內(nèi),一個(gè)問題油然而生:在英偉達(dá)構(gòu)建的這個(gè)龐大帝國面前,中國算力產(chǎn)業(yè)鏈該往哪里走?
徐凌杰說得直接:不要幻想和英偉達(dá)一樣有70%以上的毛利。把毛利降下來,把產(chǎn)業(yè)鏈帶起來,才有生存空間。除非你是華為,否則單打獨(dú)斗必?cái) N磥肀仨毿纬伞瓣嚑I”,芯片公司、AI Infra公司、模型公司緊密配合。
羅彤指出,摩爾定律消失后,算力會(huì)重新“集中化”,真正的重計(jì)算跑到云端,端側(cè)則極致追求低成本。小龍蝦(AI終端)不需要大內(nèi)存,它只是“管家”,真正的長工在數(shù)據(jù)中心。中國擁有全球最龐大的PC和消費(fèi)電子生態(tài),把端側(cè)成本做到極致,是巨大的機(jī)會(huì)。
劉昊飛提醒,國內(nèi)對熱門方向的投入極易產(chǎn)生“冗余”。各地智算中心重建設(shè)、輕應(yīng)用的現(xiàn)象依然存在。要改變這種局面,需要出現(xiàn)真正具備生態(tài)號召力的“產(chǎn)業(yè)鏈連主”,像英偉達(dá)那樣,帶著伙伴一起玩。他說,在GTC現(xiàn)場,英偉達(dá)的展商里有一大批硬件伙伴,從機(jī)架到冷卻,每個(gè)領(lǐng)域都有明確的合作品牌。英偉達(dá)推的不是自己,而是整個(gè)生態(tài)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.