337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

英偉達正在封裝世界

0
分享至


出品|虎嗅科技組

作者|陳伊凡

編輯|苗正卿

頭圖|視覺中國

剛結束的GTC上,英偉達傳遞出的一個關鍵信號是,其在不斷深化芯片提供商向AI基礎設施系統提供商的角色轉變。

英偉達正在封裝AI算力層面的基礎設施?!表f豪創芯創始合伙人王智表示,程序編寫的方式從與硬件高度耦合的機器語言到匯編語言、到接近自然語言的高級程序語言、再到Windows的GUI、進一步出現面向對象的編程......直到用Python這樣主要引用“庫”的“膠水語言”,軟件世界經歷了一個不斷將邏輯和功能高度抽象化和封裝的過程,而英偉達正在AI算力基礎設施世界展示同樣的故事

王智解釋,這種高度封裝的好處是,客戶規避了對復雜系統中基礎組件的“手搓”式采購和測試,而是可以搭積木,以樂高的方式搭建。英偉達在將這種封裝不斷擴散。

二十年前,英偉達的殺手锏是CUDA。它不只是一套編程框架,而是一個讓開發者只管寫算法、不用操心底層硬件的抽象層。CUDA的護城河不是代碼,是二十年來積累的數億裝機量、數十萬開源項目、以及所有在這套生態里長大的工程師。

但CUDA只是封裝的第一層,這篇文章要回答的三個問題:

英偉達的token分層定價,意味著什么?

收購Groq、發布專用CPU。英偉達在建立一個比CUDA更大的帝國,這個帝國長什么樣?

當這個帝國的邊界不斷擴張,創業公司還有沒有活路?窗口在哪里?

Token分層定價:封裝的結果

token正在變成大宗商品。

這是黃仁勛在演講中拋出的核心觀點。

封裝的終點,是讓復雜的東西消失在視野之外。當芯片、系統、調度軟件被一層層封裝起來,用戶感知不到GPU,感知不到算力,感知到的只剩一個單位:token。token是封裝完成之后,唯一暴露在外的接口。它變成大宗商品,是封裝的必然結果,不是偶然。

黃仁勛在演講中明確說了這句話:“Tokens are the new commodity”(Token是新的大宗商品)。大宗商品成熟之后會自然分層。他不是在描述現狀,他是在預判一個市場結構,然后把英偉達的硬件產品線,精確地鋪在這個結構的每一層上。

GTC 2026上,英偉達推出了五層Token定價體系:免費層、中級層、高級層、高速層和超高速層,對應不同的token量。

這正如當年電信行業基本沒干成的理想,也就是對數據流量進行差異化定價。背后是一個更深層的趨勢:算力需求的精細化。越是嚴肅的場景,對幻覺的容忍度越低;量化交易這種場景,需要的是微秒級的反應;自動駕駛和某些具身智能場景需要毫秒級以內的反饋速度,還得更快。不同場景的指標要求完全不同。

早期的AI應用是無差異的,一臺GPU、一套推理框架,所有請求排隊處理。但當AI真正進入工商業場景,這種大水漫灌式的供給就開始失效。一家醫院的影像輔助診斷要的是準確率,一筆高頻交易要的是微秒級延遲,一個工廠流水線上的實時質檢要的是穩定吞吐。

算力精細化的本質,是讓不同質量的算力服務找到真正需要它的場景。

但這只是表面的邏輯。更深層的,是需求側的一場根本性變化。從原來的人機交互,變為Agent-to-Agent交互,Agent把token需求從線性變成了指數,人用token是對話,使用量很有限;機器用token是工作流,單位時間消耗量是人的倍數。

這種變化已經可以在數據里看到。今年春節前后,國內大模型的流量出現了異常暴漲。那是國外很多公司在在降本——它們的Agent大量調用AI接口,而國內模型更便宜(因為中國的電便宜),于是悄悄切換了,變相助力了中國模型和token的出海。

英偉達在建立一個比CUDA更大的帝國

封裝意味著綁定。從GPU到系統,從系統到token經濟規則,英偉達每封裝一層,外部的替代成本就高一個量級,這也是英偉達為何要把封裝不斷加深的原因——你會越來越討厭他,但你會越來越離不開他。

過去幾年,這套封裝在訓練側的護城河是CUDA。但在推理側,CUDA的優勢從來沒有那么明顯。

原因在于訓練和推理的計算邏輯根本不同。GPU是并行計算的機器,擅長同時處理成千上萬個相同的操作,這正是訓練神經網絡所需要的。CUDA是駕馭GPU的語言,二十年的生態積累讓它無可替代。但推理不是這樣工作的:推理要的不是并行的暴力計算,而是低延時、快響應、靈活的任務調度。GPU做推理,就像用一輛大卡車去跑快遞,力氣有余,靈活不足。

過去兩年,很多人盯著這個裂縫,覺得推理側是繞開CUDA、挑戰英偉達的窗口。

CPU同理,GPU負責算,CPU負責管。GPU是工廠的流水線,負責大規模并行運算;CPU是工廠的調度室,負責決定任務的順序、工具的調用、數據的流向。在AI推理場景里,一個Agent接到任務后,要決定先調用哪個工具、再調用哪個模型、結果怎么傳遞——這些控制流的工作,恰恰是CPU的主場。

英偉達之前也并非沒有CPU,只是沒有那么強。

但這一次,黃仁勛明確提出,今年是英偉達的推理年。過去幾年,隨著模型深入現實世界,推理的需求開始爆發。推理硬件已被提升到核心地位。

英偉達的首席科學家Bill Dally在一次對話中提到,訓練更吃內存容量,而推理則考驗計算、內存帶寬、容量和通信之間的資源配比。他表示,推理內部也存在差異。比如預填充(Prefill)階段更像訓練:一次性處理大量數據,屬于密集計算型,受通信能耗主導。而到了解碼(Decode)階段,為了優化延遲,你通常在做極瘦矩陣運算,這會變成極端的帶寬受限和延遲受限。

Bill Dally提出了一個預判,未來至少會分化出三類硬件:一類針對訓練和預填充,一類針對解碼,而解碼類硬件內部甚至還會進一步細分。

英偉達宣布了和芯片廠商Groq的整合。訓練是計算密集型,HBM(高帶寬內存)是最優解;推理是存儲密集型,需要的是低延時、大容量的快速存儲。Groq的LPU正是為此而生:基于SRAM,片上集成,速度遠快于DRAM,極低延時。

同時英偉達發布了新的CPU,這款CPU專門為算力中心優化設計,放到其他場景反而不合適,跟英特爾打的不是同一場仗。但顯然,英偉達,正在構筑一個比CUDA更大的帝國。

王智說,英偉達正在成為算力時代的蘋果,芯片自己做,操作系統自己做,硬件自己做,應用自己控制。只不過耦合比蘋果更復雜。

創業公司的機會還有嗎

所有人都在問同一個問題:英偉達的帝國在擴大,推理市場也被它納入版圖,創業公司還有活路嗎?

關鍵在于,英偉達不會做所有的事,它的強項是系統級、規?;慕桓?,是面向數據中心的整體解決方案。而邊緣場景和中等定制化場景的特點恰恰相反:和特定場景高度綁定,需要定制化能力。一個工廠的質檢攝像頭、一輛自動駕駛汽車的車載芯片、一個手術機器人的感知模塊——這些邊緣側場景對計算的需求是高度定制化和異構的。

這里就是可重構計算的機會所在??芍貥嬘嬎憬鉀Q的是一個根本矛盾:通用芯片效率低,專用芯片太死板。如果我們拿流水線的工人做類比,普通芯片就像流水線工人,招進來只會擰螺絲,讓他去焊接?不會,得重新招人。CPU像萬能工人,什么都能干,但什么都干得不夠快??芍貥嬓酒兀褚粋€可以反復“回爐培訓”的工人,今天把他訓練成焊接工,明天把他重新訓練成噴漆工,后天再訓練成質檢員。人沒換,但技能跟著任務走,每次都能以"專業工人"的效率干活。AI時代的問題是,任務今天是這個模型、明天是那個模型,總不能每換一個任務就重新招一批專業工人。

可重構計算也是中國半導體領域少數幾個與國際差距相對較小的方向之一。

王智最近在看一些可重構計算的公司,成本更低,部署更快,適合中等程度的定制場景。

那么推理是否還有機會?王智認為,推理領域屬于目前國內剛上市(岸)的頭部算力芯片公司的機會。推理側的需求剛剛開始爆發,場景綁定的特性也給了差異化的可能。但他同時說,這也是很大的挑戰,抓不住,就很難走到下一個階段。

判斷一個公司是否抓住了機會,他給了一個具體標準:是不是足夠快地認清推理才是重點,而不是繼續把資源押在為了上市而做的、跟隨英偉達的訓練芯片路線上。

這個標準比看起來更苛刻。許多已經上市或臨近上市的國內芯片公司,此前的商業邏輯是:做一款"夠用"的訓練芯片,講一個替代英偉達的故事,完成上市。而新的邏輯需要他們放棄路徑依賴,基于中國豐富的應用場景重新建立產品定義和客戶關系

總之,領先者的優勢越來越明顯,錢、技術團隊、客戶綁定……剩下的機會不多了。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4844267.html?f=wyxwapp

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
WTT挑戰賽!首冠誕生,男單爆大冷,世界冠軍0-3慘敗,日本爭2冠

WTT挑戰賽!首冠誕生,男單爆大冷,世界冠軍0-3慘敗,日本爭2冠

帛河體育
2026-03-29 21:38:17
女生主動起來有多黏人?網友:這些女的太開放了

女生主動起來有多黏人?網友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
要么全禁要么全開!補課規則比翻書還快,家長老師集體emo

要么全禁要么全開!補課規則比翻書還快,家長老師集體emo

優墨出品
2026-03-29 16:46:32
中美俄離婚率差距斷崖:美國2.4‰,俄羅斯54%,中國令人意外

中美俄離婚率差距斷崖:美國2.4‰,俄羅斯54%,中國令人意外

混沌錄
2026-03-29 22:06:08
伊朗一對“情侶”躲進谷倉中擁吻,被發現時,已經吻了2800年

伊朗一對“情侶”躲進谷倉中擁吻,被發現時,已經吻了2800年

北海史記
2026-03-26 13:31:29
她太美了,亞洲第一美,國泰民安的臉型,無可挑剔

她太美了,亞洲第一美,國泰民安的臉型,無可挑剔

小椰的奶奶
2026-03-30 04:49:30
蘇敏旅游6年后完全認不出,連面相都變了,網友:這16萬花得值!

蘇敏旅游6年后完全認不出,連面相都變了,網友:這16萬花得值!

一盅情懷
2026-03-27 16:43:32
CBA積分榜最新排名出爐!廣東逆襲殺回前三:遼籃苦主32連敗墊底

CBA積分榜最新排名出爐!廣東逆襲殺回前三:遼籃苦主32連敗墊底

籃球快餐車
2026-03-30 03:06:31
祁東女教師的瓜

祁東女教師的瓜

皮蛋兒電影
2026-03-23 15:30:40
伊朗凌晨收到好消息,沙特和歐盟氣懵了,沒想到:特朗普膽這么肥

伊朗凌晨收到好消息,沙特和歐盟氣懵了,沒想到:特朗普膽這么肥

阿晪美食
2026-03-29 11:51:50
達芬奇《最后的晚餐》為何如此出名?放大10倍后,看看猶大的手!

達芬奇《最后的晚餐》為何如此出名?放大10倍后,看看猶大的手!

蔣南強讀歷史
2026-03-22 11:05:08
中美會談后,特朗普宣布中國將再購2000萬噸大豆

中美會談后,特朗普宣布中國將再購2000萬噸大豆

曉鰀愛八卦
2026-03-29 22:15:46
買車就送一年閃充,有人動了歪心思!如果比亞迪不管,就被薅禿了

買車就送一年閃充,有人動了歪心思!如果比亞迪不管,就被薅禿了

小李車評李建紅
2026-03-29 08:00:03
CBA一夜締造三大慘案!廣東克星38分慘?。核拇ㄖ鲌鐾?2連敗!

CBA一夜締造三大慘案!廣東克星38分慘?。核拇ㄖ鲌鐾?2連敗!

籃球快餐車
2026-03-30 03:04:14
終身追殺令生效,什葉派出終極殺招,特朗普與內塔尼亞胡無處可逃

終身追殺令生效,什葉派出終極殺招,特朗普與內塔尼亞胡無處可逃

小舟談歷史
2026-03-08 08:00:04
沖突第30天,美軍戰機被擊落?以總理或被迫下臺,特朗普態度轉變

沖突第30天,美軍戰機被擊落?以總理或被迫下臺,特朗普態度轉變

薦史
2026-03-30 00:04:20
若西方像制裁俄羅斯那樣制裁中國,會發生什么?有人進行了推演

若西方像制裁俄羅斯那樣制裁中國,會發生什么?有人進行了推演

遁走的兩輪
2026-03-26 20:41:28
中年男人無妻是啥體驗?網友:沒錢苦一輩子,跟結婚不結婚沒關系

中年男人無妻是啥體驗?網友:沒錢苦一輩子,跟結婚不結婚沒關系

帶你感受人間冷暖
2026-03-28 17:20:05
墮落的“清純女星”酒井法子,這張腿間蝴蝶背后,隱藏著的故事

墮落的“清純女星”酒井法子,這張腿間蝴蝶背后,隱藏著的故事

七阿姨愛八卦
2026-03-29 10:12:33
“??颇猩跑?小時”事件,被全網嘲笑:無知的人連裝都不會裝

“??颇猩跑?小時”事件,被全網嘲笑:無知的人連裝都不會裝

妍妍教育日記
2026-02-26 20:37:12
2026-03-30 05:31:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業資訊與觀點交流平臺
26005文章數 687640關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創始人均離職

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

頭條要聞

伊朗議長:美航母遭受巨大損失 我們絕不接受屈辱

體育要聞

絕殺衛冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

汪峰定律再現!李榮浩喊話單依純侵權

財經要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態度原創

藝術
數碼
親子
公開課
軍事航空

藝術要聞

不守墨矩的揚州八怪

數碼要聞

內存條價格被曝出現斷崖式下跌,一天跌去百元

親子要聞

罕見五胞胎全保住,20多名醫護深夜齊上陣

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美兩棲攻擊艦載3500名增援到達

無障礙瀏覽 進入關懷版