337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

不只有超強(qiáng)AI芯片!英偉達(dá)GTC會(huì)議產(chǎn)品最全總結(jié)來(lái)啦

0
分享至

在硅谷的SAP中心,一場(chǎng)與眾不同的盛會(huì)吸引了無(wú)數(shù)目光。Nvidia的掌門(mén)人,穿著皮夾克、年逾古稀的黃仁勛,站在人潮洶涌的現(xiàn)場(chǎng),他開(kāi)場(chǎng)的話(huà)語(yǔ)充滿(mǎn)了戲謔:“我希望你們明白,這里不是音樂(lè)會(huì)。”

這句話(huà)揭開(kāi)了GTC大會(huì)的序幕,這個(gè)會(huì)議與音樂(lè)會(huì)的狂熱截然不同,它是一場(chǎng)開(kāi)發(fā)者的盛宴,討論的是算法、計(jì)算機(jī)架構(gòu)和數(shù)學(xué)等科學(xué)主題。盡管如此,這位市值第三高企業(yè)的CEO,無(wú)疑在現(xiàn)場(chǎng)擁有著眾多粉絲。


黃仁勛將音樂(lè)會(huì)與音樂(lè)會(huì)相提并論并不令人意外,這個(gè)場(chǎng)地確實(shí)非常有音樂(lè)會(huì)氣氛

接下來(lái)讓我們一起看看本次的GTC大會(huì)發(fā)布了哪些產(chǎn)品吧!

Blackwell:訓(xùn)練速度提升四倍,推理性能提高三十倍

Blackwell已經(jīng)來(lái)了。Blackwell是一款由兩個(gè)全尺寸GPU組成的GPU,以“單”個(gè)(雙芯片)GPU的形式提供20 PetaFlops性能,與H100相比,其訓(xùn)練速度提升了四倍,更令人驚嘆的是,每個(gè)GPU的推理吞吐量提高了三十倍。

得益于新的、更快的第五代NVLink,Blackwell能夠擴(kuò)展至576個(gè)GPU(H100擴(kuò)展至256個(gè))。包括的第二代Transformer引擎采用FP4精度,以及一個(gè)比以前快20倍的解壓縮引擎,都為性能提升做出了貢獻(xiàn)。

GB200和NVL72:面向AI的機(jī)架規(guī)模設(shè)計(jì)點(diǎn)

GB200 和 NVL72:AI 的機(jī)架級(jí)設(shè)計(jì)點(diǎn)

然而,大部分的市場(chǎng)推廣力量并不是集中在Blackwell GPU上,而是集中在一個(gè)稱(chēng)為GB200的三芯片超級(jí)芯片上,它由兩個(gè)Blackwell和一個(gè)Grace Arm CPU組成。

這種與Grace-Hopper芯片1-1比例不同的做法非常有意義,因?yàn)閷?duì)于GH200來(lái)說(shuō),Grace的I/O和計(jì)算帶寬足以管理兩個(gè)Blackwell,即四個(gè)GPU。這應(yīng)該有助于降低使用Grace平臺(tái)的總擁有成本,也可能將Grace從Nvidia收入的一小部分轉(zhuǎn)變?yōu)樾掳惭b的重要驅(qū)動(dòng)力。

支持NVLink的GB200 NVL72機(jī)架包含72個(gè)Blackwell GPU和36個(gè)Grace CPU。Nvidia稱(chēng),這個(gè)單獨(dú)的機(jī)架就能訓(xùn)練一個(gè)27萬(wàn)億參數(shù)模型。當(dāng)然,大多數(shù)為此設(shè)計(jì)的AI工廠會(huì)使用多個(gè)機(jī)架來(lái)更快地訓(xùn)練如此龐大的模型。

Nvidia表示,其在AWS托管的Ceiba AI超級(jí)計(jì)算機(jī)現(xiàn)將由20,000個(gè)GB200 GPU組成,而不是最初宣布的16,000個(gè)H100。


Grace Blackwell 系統(tǒng)機(jī)架

每個(gè)機(jī)架放兩個(gè)GB200的計(jì)算托盤(pán),一共有18個(gè)托盤(pán)。然后兩個(gè)NVSwitch放在一個(gè)交換托盤(pán)中。一切都通過(guò)每秒2升的水冷系統(tǒng)冷卻,并且重量為3000磅。整個(gè)機(jī)架消耗120千瓦電力。


NVL72 組件

Nvidia令聽(tīng)眾驚訝地宣稱(chēng),GB200對(duì)于“傳統(tǒng)”的LLMS,如GPT3,比H100快了八倍,這已經(jīng)非常不錯(cuò)了,但對(duì)于推理1.8T參數(shù)的MoE,GB200比H100快了驚人的三十倍。

新的Transformer引擎

Transformer引擎這項(xiàng)技術(shù)允許每個(gè)張量在最優(yōu)精度下進(jìn)行計(jì)算,現(xiàn)在精度可達(dá)FP4。這意味著,如果一個(gè)競(jìng)爭(zhēng)對(duì)手的GPU有相同數(shù)量的Flops,由于Transformer引擎的作用,Blackwell在推理處理上可能會(huì)快兩倍。

Nvidia HPC和Hyperscale副總裁Ian Buck表示:“它的作用是跟蹤每層每個(gè)張量以及整個(gè)神經(jīng)網(wǎng)絡(luò)在計(jì)算過(guò)程中和模型訓(xùn)練過(guò)程中的準(zhǔn)確性動(dòng)態(tài)范圍,我們持續(xù)監(jiān)控每層的范圍并適應(yīng),以保持在數(shù)值精度的界限內(nèi),獲得最佳性能。”


第二代Transformer引擎

現(xiàn)在讓我們看看這個(gè)怪獸是如何擴(kuò)展的。Nvidia指出,今天的AI模型,如Meta Lama 2,95%是計(jì)算(和內(nèi)存)受限的,只有5%是通信受限的。

但下一代AI模型,為之設(shè)計(jì)的Grace Blackwell,使用了“專(zhuān)家混合”,其中40%是計(jì)算受限的,60%是通信受限的。他們得出結(jié)論,像H100這樣的芯片會(huì)慢18倍,因?yàn)镚PU都在嘗試彼此通信。

NVLink Gen 5:更快,帶有3.6TFlops卸載速度

Nvidia正在將NVLink擴(kuò)展到多機(jī)架規(guī)模,支持3.6TF的網(wǎng)絡(luò)內(nèi)計(jì)算,用于Scalable Hierarchical Aggregation and Reduction Protocol(SHARP)技術(shù)。

SHARP通過(guò)將操作從CPU和GPU卸載到網(wǎng)絡(luò),并消除了在端點(diǎn)之間多次發(fā)送數(shù)據(jù)的需要,改善了MPI和機(jī)器學(xué)習(xí)集體操作的性能。


新的 NVLink

DGX和DGX SuperPOd

像往常一樣,Nvidia也在為OEM和Nvidia DGX系統(tǒng)分別部署新芯片(B200和GB200)到HGX系統(tǒng)板。與NVL72不同,這兩者都是空氣冷卻的,報(bào)告稱(chēng)推理性能提高了15倍,訓(xùn)練性能提高了3倍,與DGX H100相比。

新的SuperPOD是一種以NVIDIA DGX GB200系統(tǒng)構(gòu)建的液冷機(jī)架規(guī)模架構(gòu),提供每機(jī)架11.5 exaflops的AI超級(jí)計(jì)算能力,精度為FP4,以及每機(jī)架240 terabytes的快速內(nèi)存。

每個(gè)DGX GB200系統(tǒng)都配備了36個(gè)NVIDIA GB200 Superchip — 包括36個(gè)NVIDIA Grace CPU和72個(gè)NVIDIA Blackwell GPU — 通過(guò)第五代NVIDIA NVLink作為一個(gè)超級(jí)計(jì)算機(jī)連接。

硬件可用性

那么,所有這些好東西何時(shí)開(kāi)始發(fā)貨呢?Nvidia在這個(gè)細(xì)節(jié)上有點(diǎn)含糊,但Jensen展示了每個(gè)一線CSP和每個(gè)大小的Server OEM的logo。所以,看起來(lái)Blackwell將成為2024年的收入驅(qū)動(dòng)力,B100盡快發(fā)貨,而GB200將在今年晚些時(shí)候發(fā)貨。

那么H100會(huì)怎樣呢?嗯,如果你是一個(gè)企業(yè),希望訓(xùn)練或微調(diào)一個(gè)模型,或在這些大約80B模型上運(yùn)行推理,H100將仍然是最具成本效益的平臺(tái)。但如果你是一個(gè)創(chuàng)建10萬(wàn)億參數(shù)MoE模型的AI工廠,你將需要GB200,可能還需要NVL72機(jī)架。

NIM:預(yù)建的領(lǐng)域特定推理微服務(wù)

在最后一次季度財(cái)報(bào)電話(huà)會(huì)議中,Nvidia表示,公司的軟件業(yè)務(wù)正在達(dá)到每年10億美元的運(yùn)營(yíng)規(guī)模的臨界質(zhì)量。Nvidia的軟件幫助客戶(hù)快速啟動(dòng)AI(或HPC),現(xiàn)在又邁出了下一步。公司創(chuàng)建了一個(gè)稱(chēng)為“NIM”(Nvidia推理微服務(wù))的概念,包括預(yù)建的Kubernetes容器、模型、API和推理引擎,如Triton,供開(kāi)發(fā)人員構(gòu)建領(lǐng)域特定副駕駛使用。NIM包含在Nvidia AI企業(yè)解決方案中,每GPU每年4500美元的無(wú)限制使用中。

舉例來(lái)說(shuō),如果Nvidia將100萬(wàn)GPU(大約四分之一的預(yù)期GPU出貨量)銷(xiāo)售給公司或主權(quán)數(shù)據(jù)中心,并搭配AI企業(yè)解決方案,那將產(chǎn)生45億美元的年收入,這是一個(gè)年度、黏性強(qiáng)、利潤(rùn)高的收入。當(dāng)然,Nvidia也樂(lè)意為數(shù)以?xún)|計(jì)的已安裝基礎(chǔ)GPU銷(xiāo)售額外的軟件許可。

因此,人們不禁要問(wèn)——我們是否即將從“硬件拉動(dòng)一些軟件”模式過(guò)渡到新的范式,即“軟件拉動(dòng)硬件”?業(yè)務(wù)價(jià)值和上市時(shí)間由模型和優(yōu)化軟件驅(qū)動(dòng),NIM可能使部署推理能力更加容易。Nvidia說(shuō)你可以在10分鐘內(nèi)部署一個(gè)模型。當(dāng)然,這還配備了非常酷的GPU。


Nvidia NIM:推理微服務(wù)

這里有一個(gè)NIM的例子。Nvidia一直在將“Clara”作為醫(yī)療保健行業(yè)的全面起點(diǎn)進(jìn)行市場(chǎng)營(yíng)銷(xiāo)。現(xiàn)在,有了NIM,醫(yī)療保健微服務(wù)已經(jīng)預(yù)構(gòu)建并且易于部署,具有標(biāo)準(zhǔn)的API和部署靈活性,無(wú)論是云端還是本地部署。這是Nvidia如何從一個(gè)巨大的工具箱轉(zhuǎn)變?yōu)榭上M(fèi)和可部署的AI的方式。


使用 NIMS 的醫(yī)療保健微服務(wù)

NIM微服務(wù)為從NVIDIA、A121、Adept、Cohere、蓋蒂圖片、Shutterstock以及谷歌、擁抱者AI、Meta、Mistral AI和Stability AI的開(kāi)放模型,很快還將支持微軟模型的模型部署提供最快速和最高性能的生產(chǎn)AI容器。ServiceNow宣布它正在使用NIM來(lái)更快、更經(jīng)濟(jì)地開(kāi)發(fā)和部署新的領(lǐng)域特定Copilots以及其他生成式AI應(yīng)用。

Omniverse更新

Omniverse是Nvidia用于3D協(xié)作和數(shù)字孿生的平臺(tái),繼續(xù)擴(kuò)展到新市場(chǎng)并吸引新伙伴。Nvidia宣布了新的API,以簡(jiǎn)化將CAD和CAE軟件集成到Omniverse中的過(guò)程。

“所有制造出來(lái)的東西都將有數(shù)字孿生,”NVIDIA的創(chuàng)始人兼CEO黃仁勛說(shuō)。“Omniverse是構(gòu)建和操作物理真實(shí)數(shù)字孿生的操作系統(tǒng)。Omniverse和生成式AI是數(shù)字化50000億美元重工業(yè)市場(chǎng)的基礎(chǔ)技術(shù)。”

Nvidia在GTC展會(huì)上展示的一個(gè)立即相關(guān)的用例是使用數(shù)據(jù)中心數(shù)字孿生來(lái)模擬從舊GPU技術(shù)更換到新的GB200平臺(tái)的過(guò)程。為了盡快啟用新數(shù)據(jù)中心,NVIDIA首先使用Omniverse連接的軟件工具構(gòu)建了其數(shù)字孿生。

工程師們使用Cadence Reality數(shù)字孿生平臺(tái),在全物理精度和照片級(jí)真實(shí)度的通用場(chǎng)景描述(OpenUSD)中可視化多個(gè)CAD數(shù)據(jù)集,該平臺(tái)由NVIDIA Omniverse API提供支持。這項(xiàng)技術(shù)有助于簡(jiǎn)化新的和更新的數(shù)據(jù)中心的設(shè)計(jì)和建造過(guò)程,特別是在實(shí)施像GB200平臺(tái)這樣的尖端硬件時(shí)。

CuLitho:與Synopsys和TSMC一起進(jìn)入生產(chǎn)階段

半導(dǎo)體制造業(yè)一直在探索使用計(jì)算光刻作為加速吞吐量的方法,自從Nvidia一年前引入這一概念以來(lái)。現(xiàn)在,TSMC和Synopsys準(zhǔn)備將這種光刻吞吐量40倍的改進(jìn)引入TSMC的生產(chǎn)線,而且不僅僅是最先進(jìn)的工藝節(jié)點(diǎn)。普遍認(rèn)為這個(gè)AI平臺(tái)將改變半導(dǎo)體制造業(yè)。


TSMC 和 Synopsys 已將 CiLitho 投入生產(chǎn)

結(jié)論

任何一直在想Nvidia可能會(huì)失去競(jìng)爭(zhēng)優(yōu)勢(shì)的人都應(yīng)該放心,這個(gè)領(lǐng)導(dǎo)者將繼續(xù)領(lǐng)先。有了新發(fā)現(xiàn)的4倍訓(xùn)練優(yōu)勢(shì),30倍推理優(yōu)勢(shì)和新的NIM推理部署模型,Nvidia看起來(lái)很適合應(yīng)對(duì)所有競(jìng)爭(zhēng)對(duì)手,并保持其超過(guò)80%的市場(chǎng)份額。

但毫無(wú)疑問(wèn),競(jìng)爭(zhēng)已經(jīng)從唯一一個(gè)可行的替代品(谷歌TPU)變成了至少8個(gè),增加了AMD MI300、Intel Gaudi、Microsoft Maia、AWS芯片、Meta MTIA Cerebras和Groq,還有更多準(zhǔn)備加入戰(zhàn)場(chǎng)的選手。

隨著這些玩家將他們的芯片推向市場(chǎng),Nvidia的軟件堆棧增加了他們必須克服的挑戰(zhàn)。我們暫時(shí)還沒(méi)有看到任何人在像NIMS和Omniverse以及企業(yè)AI這樣的軟件上即將接近Nvidia,盡管LLM模型和OpenAI Triton在整個(gè)領(lǐng)域的可用性可能在某種程度上削弱這一優(yōu)勢(shì)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這就是公開(kāi)辱華的后果!取消冠軍頭銜只是開(kāi)始,職業(yè)生涯也全毀了

這就是公開(kāi)辱華的后果!取消冠軍頭銜只是開(kāi)始,職業(yè)生涯也全毀了

阿鳧愛(ài)吐槽
2025-12-17 17:24:39
李昊又一逆天撲救!門(mén)線極限神撲,媒體人狂贊:國(guó)足該場(chǎng)場(chǎng)首發(fā)

李昊又一逆天撲救!門(mén)線極限神撲,媒體人狂贊:國(guó)足該場(chǎng)場(chǎng)首發(fā)

奧拜爾
2026-04-17 19:24:25
談判破裂,川普的“二道封鎖”,德黑蘭錯(cuò)過(guò)了最后的臺(tái)階

談判破裂,川普的“二道封鎖”,德黑蘭錯(cuò)過(guò)了最后的臺(tái)階

番外行
2026-04-18 08:37:36
如果侯長(zhǎng)榮演了賈寶玉,誰(shuí)能做他的林妹妹

如果侯長(zhǎng)榮演了賈寶玉,誰(shuí)能做他的林妹妹

我來(lái)我看見(jiàn)
2026-04-17 21:12:29
三國(guó)志英杰傳:魏延武力值很高,但幾乎沒(méi)人將他列為99級(jí)必練角色

三國(guó)志英杰傳:魏延武力值很高,但幾乎沒(méi)人將他列為99級(jí)必練角色

單機(jī)時(shí)代
2026-04-17 19:13:48
賣(mài)房湊了90萬(wàn),妻子鼻咽癌放療后大出血,在搶救室沒(méi)來(lái)得及說(shuō)再見(jiàn)

賣(mài)房湊了90萬(wàn),妻子鼻咽癌放療后大出血,在搶救室沒(méi)來(lái)得及說(shuō)再見(jiàn)

墜入二次元的海洋
2026-04-17 12:41:40
曝烏克蘭突襲攻入俄羅斯領(lǐng)土!控制庫(kù)爾斯克5塊陣地

曝烏克蘭突襲攻入俄羅斯領(lǐng)土!控制庫(kù)爾斯克5塊陣地

項(xiàng)鵬飛
2026-04-16 19:16:05
55歲"紙片人"魯豫,與小19歲男友同居后變樣,如今她令人大跌眼鏡

55歲"紙片人"魯豫,與小19歲男友同居后變樣,如今她令人大跌眼鏡

觀察鑒娛
2026-04-17 09:43:01
雷軍直播全新小米SU7京滬長(zhǎng)途續(xù)航測(cè)試,保障車(chē)竟是理想L9

雷軍直播全新小米SU7京滬長(zhǎng)途續(xù)航測(cè)試,保障車(chē)竟是理想L9

識(shí)礁Farsight
2026-04-17 14:16:36
婚外情,悄悄發(fā)生的幾個(gè)信號(hào),很好判斷

婚外情,悄悄發(fā)生的幾個(gè)信號(hào),很好判斷

葉飛飛情感屋
2026-04-17 14:45:24
廣東一“釣魚(yú)佬”救起跳橋女子,救人者回應(yīng):她漂了500米到釣魚(yú)位置,跳橋原因是其與家人發(fā)生矛盾

廣東一“釣魚(yú)佬”救起跳橋女子,救人者回應(yīng):她漂了500米到釣魚(yú)位置,跳橋原因是其與家人發(fā)生矛盾

環(huán)球網(wǎng)資訊
2026-04-17 21:29:50
你敢信嗎?太湖底下有2.3米厚的淤泥,可上面才蓋著不到1.9米的水

你敢信嗎?太湖底下有2.3米厚的淤泥,可上面才蓋著不到1.9米的水

掠影后有感
2026-04-01 20:26:07
單方一味,只需一味中藥,這9種病皆可用

單方一味,只需一味中藥,這9種病皆可用

環(huán)京快爆
2026-04-14 10:52:47
雅安抓了個(gè)間諜,我第一反應(yīng)不是害怕,是出戲

雅安抓了個(gè)間諜,我第一反應(yīng)不是害怕,是出戲

情感大頭說(shuō)說(shuō)
2026-04-17 17:29:54
市場(chǎng)上這5種魚(yú),目前無(wú)法人工養(yǎng)殖,都是野生魚(yú),肉厚刺少營(yíng)養(yǎng)高

市場(chǎng)上這5種魚(yú),目前無(wú)法人工養(yǎng)殖,都是野生魚(yú),肉厚刺少營(yíng)養(yǎng)高

秀廚娘
2026-04-15 10:25:17
風(fēng)波過(guò)后,浦開(kāi)集團(tuán)叫停銷(xiāo)售

風(fēng)波過(guò)后,浦開(kāi)集團(tuán)叫停銷(xiāo)售

地產(chǎn)K線官方
2026-04-17 16:39:11
三大艦隊(duì)已無(wú)法滿(mǎn)足需求?一旦組建第四艦隊(duì),駐地在哪最為精妙?

三大艦隊(duì)已無(wú)法滿(mǎn)足需求?一旦組建第四艦隊(duì),駐地在哪最為精妙?

混沌錄
2026-04-05 16:12:05
性需求是人的活力來(lái)源,性需求是成年人最強(qiáng)大的生命力

性需求是人的活力來(lái)源,性需求是成年人最強(qiáng)大的生命力

加油丁小文
2026-04-03 11:30:07
禁購(gòu)伊朗石油24小時(shí)內(nèi),伊外長(zhǎng)致電中國(guó),中方堅(jiān)定回應(yīng)

禁購(gòu)伊朗石油24小時(shí)內(nèi),伊外長(zhǎng)致電中國(guó),中方堅(jiān)定回應(yīng)

觀察者海風(fēng)
2026-04-17 21:27:46
伊朗終于不忍了,打響反封鎖第一槍?zhuān)坏?4小時(shí),就傳來(lái)壞消息

伊朗終于不忍了,打響反封鎖第一槍?zhuān)坏?4小時(shí),就傳來(lái)壞消息

書(shū)紀(jì)文譚
2026-04-17 16:03:23
2026-04-18 09:32:49
北茗的AI茶館 incentive-icons
北茗的AI茶館
探討AI領(lǐng)域內(nèi)容,展望人機(jī)共生的美好未來(lái)!
69文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

7家頭部平臺(tái)被罰沒(méi)35.97億元

頭條要聞

“張雪機(jī)車(chē)”奪超級(jí)桿位賽第二名

頭條要聞

“張雪機(jī)車(chē)”奪超級(jí)桿位賽第二名

體育要聞

中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

娛樂(lè)要聞

劉德華摯友潘宏彬離世 曾一起租房住

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0:管理層如何吸血萬(wàn)物云?

汽車(chē)要聞

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

手機(jī)
本地
時(shí)尚
公開(kāi)課
軍事航空

手機(jī)要聞

華為Pura X Max再次被確認(rèn):屏幕參數(shù)已清晰,折痕和耐用性拉滿(mǎn)!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

今日熱點(diǎn):許光漢否認(rèn)和周子瑜戀情;郝熠然與誠(chéng)實(shí)一口終止合作……

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美宣布黎以停火10天 以方稱(chēng)不會(huì)撤軍

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版