![]()
在2026年GTC大會上,日立萬塔拉和Nutanix宣布支持英偉達的新型GPU和軟件,與其他存儲系統廠商一樣,而IBM則將Watsonx和其他產品與英偉達的產品進行了更緊密的集成。希捷展示了由SSD和磁盤驅動器組成的雙層混合外部KV緩存,正如去年所做的那樣。
可以將所有存儲公司想象成圍繞英偉達這個巨大太陽運行的行星,每家公司都試圖盡可能接近英偉達,以便在向客戶銷售產品時獲得優勢。
日立萬塔拉
日立萬塔拉的Hitachi iQ是一個硬件和軟件產品組合,旨在幫助企業部署和運營AI基礎設施,構建在虛擬存儲平臺One(VSP One)存儲系統之上。它將加速計算、網絡和存儲集成到一個驗證的基礎設施堆棧中,并支持日立的HMAX軟件套件,將AI引入社會基礎設施。Hitachi iQ現在支持:
英偉達Blackwell GPU(風冷)
Blackwell Ultra GPU(風冷和液冷)
基于英偉達MGX的系統,最多配備四個RTX PRO 6000 Blackwell服務器版GPU
Hitachi iQ還計劃支持新發布的RTX PRO 4500 Blackwell服務器版GPU
日立萬塔拉將支持英偉達的STX參考架構,開發運行在Vera Rubin GPU、BlueField-4 DPU和Spectrum-X網絡以及其AI軟件上的AI原生存儲系統。
Hitachi iQ Studio軟件基于英偉達的AI數據平臺參考設計構建,包括擴展的AI藍圖和多智能體協調功能。新的藍圖引入了定義的智能體角色,包括監督者和工作者模型。工作者智能體執行任務,而監督者智能體協調多智能體工作流程并根據結果進行調整。
Hitachi iQ Studio還擴展了對Nemotron模型的支持,這些大語言模型旨在為先進的工具使用智能體AI系統提供動力,并引入了時間機器功能,使AI系統能夠導航歷史數據集。這種時間感知智能增強了可解釋性,并支持依賴長期數據模式來做出決策的客戶。
現在Hitachi iQ Studio和Hammerspace之間有了更緊密的集成,以簡化智能體驅動工作流程的數據訪問。通過這種擴展功能,由Hammerspace管理的數據可以使用模型上下文協議(MCP)在Hitachi iQ Studio內直接訪問,MCP是一個開放標準,允許AI系統安全地連接到外部數據源。
這使客戶能夠在Hitachi iQ Studio中構建AI智能體,這些智能體可以使用并幫助管理他們的Hammerspace數據環境,將自動化和洞察力直接擴展到分布式數據,而無需重新定位。數據在VSP One內保持受管理和保護。
IBM
IBM提供了關于其與英偉達合作的四個要點:
加速結構化數據分析。
英偉達cuDF和IBM Watsonx.data的SQL引擎Presto的開源集成將能夠在大型數據集上實現更快的查詢執行。為了驗證這一點,IBM和英偉達將GPU加速的watsonx.data應用于雀巢的訂單到現金數據集市。Watsonx.data將查詢運行時間從15分鐘減少到3分鐘——實現了83%的成本節約和整體30倍的價格性能提升。
釋放企業數據的全部價值。
公司正在使用IBM的Docling和英偉達Nemotron開放模型來解決非結構化數據問題——這一組合旨在在企業規模上提供智能文檔提取。
優化基礎設施。
英偉達正在為其GPU原生高級分析引擎使用10PB的Storage Scale System 6000。對于數字主權是一個因素的受監管行業,IBM和英偉達正在探索IBM Sovereign Core與英偉達基礎設施和Nemotron模型的集成。
推進企業AI堆棧。
IBM正在IBM云上提供Blackwell Ultra GPU,用于大規模訓練、高吞吐量推理和AI推理。這項技術還將通過Red Hat AI Factory與英偉達和VPC服務器集成。此外,IBM咨詢計劃通過IBM咨詢優勢將Red Hat AI Factory與英偉達帶給客戶。
Nutanix
Nutanix宣布了Nutanix智能體AI,這是一個全棧軟件解決方案,旨在幫助客戶加速采用智能體AI。
Nutanix產品管理執行副總裁Thomas Cornely在聲明中說:"Nutanix智能體AI擴展了我們的AHV虛擬化程序、Flow虛擬網絡、Nutanix Kubernetes平臺和Nutanix企業AI,為企業AI工廠提供云操作模型,使基礎設施和平臺團隊能夠簡單地構建、操作和管理AI工廠,同時為智能體AI開發人員提供他們需要的性能和豐富的模型和AI平臺服務集合。"
Nutanix智能體AI在智能體構建器層與英偉達AI企業版集成,并為支持的配置編排英偉達認證的AI工廠生態系統。它使客戶能夠構建、運行和保護智能體AI應用程序,配備一套基礎設施編排和安全軟件,以及面向數據科學家和智能體AI開發人員的AI平臺服務(PaaS)和模型即服務(MaaS)。
更詳細地說:
Nutanix企業AI(NAI)v2.6包括一個AI網關服務,用于對云托管和私有大語言模型進行統一策略控制。對模型上下文協議(MCP)服務器和微調的新支持擴展了其現有的MaaS功能,使智能體能夠安全地連接到企業工具和數據源。NAI還支持Nemotron系列開源AI模型、數據集和訓練工具。
Nutanix已經擴展了其符合CNCF標準的Nutanix Kubernetes平臺(NKP),配備了一套預構建的開源AI開發工具,包括筆記本、向量數據庫、MLOps工作流引擎和智能體框架。由于其英偉達AI企業版集成,開發人員可以即時部署英偉達NIM,包括Nemotron。
AHV虛擬化程序已得到增強,可以自動優化在GPU密集服務器上的物理資源到虛擬機的分配,并幫助最大化性能。Flow虛擬網絡軟件已得到增強,可以將網絡數據平面卸載到BlueField DPU,減少主機CPU和內存消耗。
Nutanix統一存儲為數千個GPU客戶端提供線性可擴展的讀/寫性能。Nutanix提供了一個可擴展、低延遲的數據結構,通過為KV緩存卸載提供高容量層和支持基于RDMA的S3和基于RDMA的NFS來最大化GPU效率。
Nutanix智能體AI軟件包含已普遍可用或目前處于早期訪問階段且預計很快可用的產品。
希捷
希捷展示了其磁盤JBOD(磁盤盒)支持超微KV緩存擴展SSD JBOF(閃存盒),并提到了其NVMe訪問磁盤驅動器的想法,但不像在2025年GTC上那樣突出。
KV緩存擴展演示包括:
英偉達GB10 GPU集群計算節點,配備用于大語言模型部署的Dynamo KV塊管理器。
兩個BlueField-4(BF-4)DPU,通過以太網連接到GPU服務器,控制NVMe-oF和緩存,配備Linux集群卷管理和SPDK緩存
超微NVMe-oF BOF作為高速網絡NVMe SSD緩存層,將即時上下文保持在計算附近,通過PCIe連接到BF-4。24個32TB NVMe SSD提供720TB容量
SAS連接的希捷Exos 4U74硬盤JBOD,由74個32TB SATA Exos組成混合SSD/HDD NVMe-oF目標,提供2.4PB容量。
超微的EMEA總裁兼董事總經理、技術和AI高級副總裁Vik Malyala說:"結合超微的JBOF閃存層和希捷的硬盤層可以大幅降低推理成本,同時提供高性能。"
希捷和超微表示,智能AI堆棧將短期內存(閃存)與長期內存(磁盤)分離,并將每個層用于其最擅長的工作:
實時訪問層(GPU HBM內存、CPU DRAM、本地和網絡NVMe SSD):處理"現在"的上下文——活躍Token、熱嵌入和頻繁訪問的數據
容量層(由硬盤構建):保存"長期"上下文——大型數據集、長期歷史和擴展智能體內存
所有層都有自動數據放置,DPU協調跨層的數據移動和緩存,這樣使用成本更低的閃存,因為"硬盤為長期內存提供了顯著更低的每GB成本。"
圖表顯示測試結果表明,在首Token時間方面,混合SSD/HDD緩存與本地NVMe SSD之間幾乎沒有差異。
希捷表示其系統可以擴展并可以容納更新的組件。其幻燈片顯示了從今天的BlueField-3跳轉到未來某個時候的BlueField-4,然后從SATA跳轉到未來的NVMe連接磁盤驅動器。這與2025年GTC上的類似演示形成對比,當時它使用了原型NVMe磁盤驅動器。
目前還不需要它們,盡管希捷隨后指出NVMe硬盤消除了對HBA、協議橋接器和額外SAS基礎設施的需求,并提供了簡化AI存儲的統一NVMe架構。
這是一個演示,沒有實際的希捷/超微組合JBOF/JBOD/DPU產品。如果KV緩存擴展變得普遍,如果NAND價格繼續變得更加昂貴和稀缺,那么希捷也許有辦法將HDD銷售到KV緩存擴展市場。值得贊揚的嘗試。
Q&A
Q1:什么是KV緩存擴展技術?它有什么作用?
A:KV緩存擴展是一種將短期內存(閃存)與長期內存(硬盤)分離的技術。實時訪問層處理活躍Token和頻繁訪問的數據,而容量層保存大型數據集和長期歷史。這種技術可以大幅降低推理成本同時保持高性能,希捷和超微的測試顯示混合SSD/HDD緩存與本地NVMe SSD在首Token時間方面幾乎沒有差異。
Q2:日立萬塔拉的Hitachi iQ支持哪些英偉達GPU?
A:Hitachi iQ現在支持英偉達Blackwell GPU(風冷)、Blackwell Ultra GPU(風冷和液冷)、基于英偉達MGX的系統(最多配備四個RTX PRO 6000 Blackwell服務器版GPU),并且計劃支持新發布的RTX PRO 4500 Blackwell服務器版GPU。該系統還將支持英偉達的STX參考架構。
Q3:IBM與英偉達的合作在數據分析方面有什么突破?
A:IBM通過英偉達cuDF和IBM Watsonx.data的SQL引擎Presto的開源集成實現了顯著突破。在雀巢的訂單到現金數據集市驗證中,GPU加速的watsonx.data將查詢運行時間從15分鐘減少到3分鐘,實現了83%的成本節約和整體30倍的價格性能提升。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.