網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

英偉達推出Nemotron 3系列開放模型，AI Agent開源了？

2025-12-16 20:26:05　來源: 光錐智能

北京舉報

分享至

文｜劉俊宏

編｜王一粟

在AI大模型走向應用的時代，AI“賣鏟人”英偉達又帶來了最新的“參考答案”。

12月15日，英偉達正式發(fā)布了Nemotron 3系列開放AI模型。該模型系列包含Nano、Super和Ultra三種規(guī)模，模型主打效率和領先的精度，適用于AI Agent的應用開發(fā)。

對于這套模型，英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛總結說：“開放創(chuàng)新是AI進步的基礎。通過Nemotron，我們將先進AI轉化成開放平臺，為開發(fā)者提供構建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”

本次發(fā)布的三個規(guī)模的模型，英偉達的設計目標非常明確，直指AI應用中的高效和節(jié)能。

Nemotron 3 Nano模型目前已經(jīng)上線。該模型參數(shù)總量為300億，由于模型采用了獨特的異構MoE架構，這使得每次運行時只需激活30億參數(shù)。模型能按需使用，非常省電。相比上一代模型，Nemotron 3 Nano速度快4倍，成本低60%，非常適合寫代碼、總結文檔、當智能助手等日常任務。此外，模型還支持100萬token的上下文記憶能力。這相當于記住幾本書的內容，保證模型在使用中不會輕易忘事。

Nemotron 3 Super模型，預計于2026上半年推出，主打多智能體協(xié)作完成任務。該模型參數(shù)總量約1000億，每個token最多激活100億參數(shù)，也是兼具了節(jié)能和高效。

Nemotron 3 Ultra模型，同樣預計于2026上半年推出。主要面對高級推理引擎，服務于需要深度研究和策略規(guī)劃的AI工作流，是Nemotron 3系列的“最強大腦”。該模型參數(shù)約5000億，每個token最多激活500億參數(shù)，適用于復雜的AI應用。

值得注意的是，Nemotron 3 Super與Ultra采用基于NVIDIA Blackwell架構的4位NVFP4訓練格式，可顯著降低顯存需求并加速訓練進程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎設施上進行訓練，不會因更高精度格式而犧牲準確性。

簡單來說，是就是之前訓練一個大模型需要最新、最好的GPU集群才能兼顧準確性和效率。現(xiàn)在開發(fā)者可以在現(xiàn)有硬件上訓練，不需要擔心低精度會讓AI“變傻”的問題。

英偉達推出Nemotron 3系列模型的想法，是想讓開發(fā)者能根據(jù)特定工作負載選擇更合適自己的開放模型。AI任務能在數(shù)十至數(shù)百個智能體間靈活擴展，同時在復雜工作流中獲得更快速、精準的長時推理能力。

簡單來說，就是英偉達為AI開發(fā)者提供了一套AI“積木”。應對一項“大工程”，開發(fā)者可以按需選擇有小磚（Nano快）、中磚（Super穩(wěn)）和大磚（Ultra強）。或者同時招募幾十上百個“工人”（智能體）一起干活。

為了更方便開發(fā)者使用，本次英偉達在開源了模型之余，還開放了訓練數(shù)據(jù)集和前沿強化學習庫。

為了給開發(fā)者示范高性能特定領域智能體如何創(chuàng)建推理、編碼及多步驟的工作流，英偉達本次公開了3 萬億token規(guī)模的全新Nemotron預訓練、后訓練及強化學習數(shù)據(jù)集。Nemotron Agentic Safety Dataset工具提供真實場景的遙測數(shù)據(jù)，幫助團隊評估并提升復雜智能體系統(tǒng)的安全性。

為了加速AI開發(fā)進程，英偉達發(fā)布了NeMo Gym與NeMo RL開源庫。這能為Nemotron 模型提供訓練環(huán)境及后訓練基礎。在驗證模型安全性和性能環(huán)節(jié)，英偉達還推出了NeMo Evaluator。目前這些工具，都已經(jīng)在GitHub和Hugging Face平臺上線。

開發(fā)工具層面，Nemotron 3 已獲得LM Studio 、llama.cpp、SGLang 和vLLM支持。Prime Intellect與Unsloth正將NeMo Gym的即用型訓練環(huán)境直接集成至其工作流，使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。

為了方便Nemotron 3模型落地，AI云廠商們也做好了相應的準備。

目前，Nemotron 3 Nano已上線于Hugging Face平臺，提供推理服務的廠商有Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等公司。Nemotron還上線了多個企業(yè)級 AI 與數(shù)據(jù)基礎設施平臺，包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外，Nemotron 3 Nano將通過Amazon Bedrock（無服務器模式）在亞馬遜云科技平臺上提供給使用公有云的客戶，并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。Nemotron 3 Nano 同時還可以用 NVIDIA NIM 形式提供，開發(fā)者可在英偉達自己的平臺上選用。

總體來看，Nemotron 3 是英偉達想讓AI被更多人使用的一次努力。作為算力供應商的英偉達，依然是為開發(fā)者降低AI門檻，做開源生態(tài)的姿態(tài)。畢竟，只有AI開發(fā)者能一起賺錢，英偉達的GPU才能賣得更多。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.