![]()
文|劉俊宏
編|王一粟
在AI大模型走向應用的時代,AI“賣鏟人”英偉達又帶來了最新的“參考答案”。
12月15日,英偉達正式發(fā)布了Nemotron 3系列開放AI模型。該模型系列包含Nano、Super和Ultra三種規(guī)模,模型主打效率和領先的精度,適用于AI Agent的應用開發(fā)。
對于這套模型,英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛總結說:“開放創(chuàng)新是AI進步的基礎。通過Nemotron,我們將先進AI轉化成開放平臺,為開發(fā)者提供構建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”
本次發(fā)布的三個規(guī)模的模型,英偉達的設計目標非常明確,直指AI應用中的高效和節(jié)能。
Nemotron 3 Nano模型目前已經(jīng)上線。該模型參數(shù)總量為300億,由于模型采用了獨特的異構MoE架構,這使得每次運行時只需激活30億參數(shù)。模型能按需使用,非常省電。相比上一代模型,Nemotron 3 Nano速度快4倍,成本低60%,非常適合寫代碼、總結文檔、當智能助手等日常任務。此外,模型還支持100萬token的上下文記憶能力。這相當于記住幾本書的內容,保證模型在使用中不會輕易忘事。
Nemotron 3 Super模型,預計于2026上半年推出,主打多智能體協(xié)作完成任務。該模型參數(shù)總量約1000億,每個token最多激活100億參數(shù),也是兼具了節(jié)能和高效。
Nemotron 3 Ultra模型,同樣預計于2026上半年推出。主要面對高級推理引擎,服務于需要深度研究和策略規(guī)劃的AI工作流,是Nemotron 3系列的“最強大腦”。該模型參數(shù)約5000億,每個token最多激活500億參數(shù),適用于復雜的AI應用。
![]()
值得注意的是,Nemotron 3 Super與Ultra采用基于NVIDIA Blackwell架構的4位NVFP4訓練格式,可顯著降低顯存需求并加速訓練進程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎設施上進行訓練,不會因更高精度格式而犧牲準確性。
簡單來說,是就是之前訓練一個大模型需要最新、最好的GPU集群才能兼顧準確性和效率。現(xiàn)在開發(fā)者可以在現(xiàn)有硬件上訓練,不需要擔心低精度會讓AI“變傻”的問題。
英偉達推出Nemotron 3系列模型的想法,是想讓開發(fā)者能根據(jù)特定工作負載選擇更合適自己的開放模型。AI任務能在數(shù)十至數(shù)百個智能體間靈活擴展,同時在復雜工作流中獲得更快速、精準的長時推理能力。
簡單來說,就是英偉達為AI開發(fā)者提供了一套AI“積木”。應對一項“大工程”,開發(fā)者可以按需選擇有小磚(Nano快)、中磚(Super穩(wěn))和大磚(Ultra強)。或者同時招募幾十上百個“工人”(智能體)一起干活。
為了更方便開發(fā)者使用,本次英偉達在開源了模型之余,還開放了訓練數(shù)據(jù)集和前沿強化學習庫。
為了給開發(fā)者示范高性能特定領域智能體如何創(chuàng)建推理、編碼及多步驟的工作流,英偉達本次公開了3 萬億token規(guī)模的全新Nemotron預訓練、后訓練及強化學習數(shù)據(jù)集。Nemotron Agentic Safety Dataset工具提供真實場景的遙測數(shù)據(jù),幫助團隊評估并提升復雜智能體系統(tǒng)的安全性。
為了加速AI開發(fā)進程,英偉達發(fā)布了NeMo Gym與NeMo RL開源庫。這能為Nemotron 模型提供訓練環(huán)境及后訓練基礎。在驗證模型安全性和性能環(huán)節(jié),英偉達還推出了NeMo Evaluator。目前這些工具,都已經(jīng)在GitHub和Hugging Face平臺上線。
開發(fā)工具層面,Nemotron 3 已獲得LM Studio 、llama.cpp、SGLang 和vLLM支持。Prime Intellect與Unsloth正將NeMo Gym的即用型訓練環(huán)境直接集成至其工作流,使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。
為了方便Nemotron 3模型落地,AI云廠商們也做好了相應的準備。
目前,Nemotron 3 Nano已上線于Hugging Face平臺,提供推理服務的廠商有Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等公司。Nemotron還上線了多個企業(yè)級 AI 與數(shù)據(jù)基礎設施平臺,包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外,Nemotron 3 Nano將通過Amazon Bedrock(無服務器模式)在亞馬遜云科技平臺上提供給使用公有云的客戶,并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。Nemotron 3 Nano 同時還可以用 NVIDIA NIM 形式提供,開發(fā)者可在英偉達自己的平臺上選用。
總體來看,Nemotron 3 是英偉達想讓AI被更多人使用的一次努力。作為算力供應商的英偉達,依然是為開發(fā)者降低AI門檻,做開源生態(tài)的姿態(tài)。畢竟,只有AI開發(fā)者能一起賺錢,英偉達的GPU才能賣得更多。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.