昨天,我們報道了英偉達 CEO 黃仁勛的長博客。
人工智能基礎設施被分成了「五層蛋糕」:能源 → 芯片 → 基礎設施 → 模型 → 應用。
事實上,英偉達本身已經成為了人工智能時代基礎設施的一部分,尤其是芯片,以及「AI 工廠」類基礎設施。
而黃老板的期待遠不止如此,英偉達似乎正在嘗試進入「五層蛋糕」的每一層。在 2023 年 11 月,英偉達推出首個Nemotron 模型,說明英偉達正式嘗試進入通用大模型領域,開始嘗試將 CUDA 生態與自研模型深度結合的路徑。
Nemotron 系列模型嘗試過很多技術路線,包括多種混合架構模型,有 Mamba-Transformer 的 Nemotron-H ,Llama-Nemotron,Jet-Nemotron 等等,一直到近期的混合專家架構的 Nemotron 3……
雖說英偉達在這些開源模型中不乏性能強大的模型,甚至站在過開源模型的第一梯隊,但大家都能看出 Nemotron 似乎總帶著點技術試驗的底色。
不過,英偉達在開源模型研究上是認真的。
據《WIRED》雜志報道,英偉達高管證實了這一此前從未被報道過的消息。
![]()
大家都說英偉達是「淘金熱里買鏟子」的聰明人。但這筆巨額投資預示著英偉達正經歷一場蛻變。當買鏟子的人下場淘金,是為了更好地賣鏟子,還是希望徹底占據這片金礦?
周三,英偉達發布了其迄今為止性能最強的開源模型 Nemotron 3 Super。該模型擁有 1280 億個參數,這使其在體量上大致等同于 OpenAI 旗下的最大版本 GPT-OSS。英偉達聲稱該模型在多項基準測試中的表現均優于 GPT-OSS 及其他同類模型。
「英偉達正在以更加嚴肅的態度對待開源模型的開發,并正在取得進步。」 英偉達應用深度學習研究副總裁布萊恩?卡坦扎羅(Bryan Catanzaro)表示。
不過,英偉達正式投入開源模型研發的事情仍然有些讓人費解。
![]()
針對這個問題,英偉達企業級生成式 AI 軟件副總裁卡里?布里斯基(Kari Briski)給出了答案。
英偉達未來的 AI 模型不僅能夠幫助公司改進芯片,還將提升其構建的超算級數據中心。她說:「我們構建模型是為了突破系統的極限,這不僅是為了測試計算能力,還包括存儲和網絡,并以此來構建我們的硬件架構路線圖。」
除此以外,目前的前沿領先開源模型幾乎都集中在中國。包括 DeepSeek、Qwen、月之暗面、智譜以及 MiniMax 等等許多中國頂尖模型都選擇了免費且開放權重。
因此,全球許多初創公司和研究人員目前都在基于中國模型進行開發。這或許是英偉達投入開放權重大模型研發的重要驅動力之一。
計算機科學家、致力于推動 AI 開放性的非營利組織 Laude Institute 負責人安迪?康溫斯基(Andy Konwinski)認為,「(英偉達)處于眾多開源和閉源 AI 工作的最前沿,」 康溫斯基表示,「這是他們對開放抱有信念的空前信號。」
英偉達從算力供應商向全棧 AI 巨頭的戰略轉型,其目標直指 OpenAI 和 DeepSeek 所在的前沿模型領域。
這種「以模型帶硬件」的策略,通過對底層芯片能力的極致優化能力,旨在全球 AI 基礎設施競爭中,進一步加固其在 AI 算力霸權上的護城河。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.