【速報】NVIDIA Nemotron 3 Super リリース｜120Bパラメータ・5倍スループット・DeepResearch Bench首位

Q: NemoClaw から呼び出せますか？

はい。NemoClaw のモデル選択UIから「Nemotron 3 Super」を選択するだけで切替可能。詳細は Nemotron推論プロファイル解説 を参照。

Q: コストはどのくらい？

オープンウェイトなのでモデル自体は無料。実行コストは GPU 利用料に依存。 NemoClaw導入費用の完全ガイド で詳細試算を確認してください。

発表概要

NVIDIAは2026年3月11日（米国時間）、エージェント型AI向けに最適化された新しいオープン推論モデル「Nemotron 3 Super」をリリースしました。Nemotron 3 ファミリーの中核モデルで、2025年12月発表のNano（最小・最速）に続く第2弾。120Bパラメータ（うち12Bアクティブ）のhybrid mixture-of-experts設計で、Mambaレイヤーと Transformerレイヤーを組み合わせた新アーキテクチャを採用しています。

NemoClaw（NVIDIAのエンタープライズAIエージェント基盤）上でも標準サポートされ、本稿執筆時点でbuild.nvidia.com・Perplexity・OpenRouter・Hugging Face・Google Cloud Vertex AI・Oracle Cloud Infrastructure 等で利用開始されています。

主要スペック・性能数値

項目	Nemotron 3 Super	前世代（Nemotron Super）比
総パラメータ	120B	同等規模
アクティブパラメータ	12B	—
スループット	5倍向上	+400%
精度	最大2倍向上	+100%
推論速度	3倍高速（multi-token prediction）	+200%
Blackwell NVFP4 vs Hopper FP8	4倍高速	+300%
コンテキスト窓	1,000,000 token	1Mに拡張
アーキテクチャ	Mamba + Transformer hybrid MoE	新規
ライセンス	Open weights（permissive）	商用利用可

特に注目すべきは NVFP4精度のサポートで、Blackwell GPU上で FP8 on Hopper の4倍の推論速度を実現します。エンタープライズPoCで重視される1M tokenコンテキストも大型ドキュメント解析・長期会話エージェントの実用化に直結します。

ベンチマーク：DeepResearch Bench I/II で首位

独立ベンチマークサイト Artificial Analysis では効率性とオープン性の両軸で首位を獲得。さらに DeepResearch Bench I・II の両方で 1位を記録し、Anthropic Claude・OpenAI GPT・Meta Llama 等のクローズド/オープン両陣営を上回るスコアを示しました。

DeepResearch Benchは深層リサーチ・複数情報源統合タスクの精度を評価するエージェント特化ベンチマーク。商用エンタープライズ案件で重要視される「複数文書を横断して結論を出す」能力を測定します。

ダウンロード・利用可能プラットフォーム

2026年3月リリース時点で以下から利用可能：

build.nvidia.com（NVIDIA NIM経由）
Hugging Face（open weights）
Perplexity / OpenRouter（API経由）
Google Cloud Vertex AI / Oracle Cloud Infrastructure
Coreweave / Crusoe / Nebius / Together AI
Baseten / Cloudflare / DeepInfra / Fireworks AI 等

NemoClaw からの利用は標準のモデル選択UIから「Nemotron 3 Super」を選択するだけで切替可能です。詳細はNemotron推論プロファイル解説を参照。

国内エンタープライズ導入の観点

Nemotron 3 Super は商用利用可のオープンウェイトであり、自社プライベートクラウド・オンプレ環境での運用が可能です。これは医療・金融・公共セクター等のデータ主権要件が厳しい業界にとって決定的なメリットです。

1M tokenコンテキストは契約書解析・カルテ統合・規制文書照合などの本番タスクを単一推論で完結させる能力を持ち、従来複数回の RAG が必要だったワークフローを簡略化できます。NemoClaw導入のROI計算方法と合わせて投資判断の参考にしてください。

競合モデルとの位置付け

モデル	パラメータ	コンテキスト	商用利用	主な強み
Nemotron 3 Super	120B (12B active)	1M token	◎ permissive	5x throughput・DeepResearch首位
Llama 3.3 70B	70B	128K	○ Meta license	OSS定番・Instruct
Mistral Large 2	123B	128K	△ Research only	多言語
DeepSeek V3	671B (37B active)	128K	○ MIT	コスト効率
Qwen 2.5 72B	72B	128K	○ Apache 2.0	中国市場

パラメータ数で見ると DeepSeek V3 (671B) が最大ですが、Nemotron 3 Super はアクティブ12Bで効率を保ちつつ DeepResearch Bench 首位という、「効率×精度×オープン性」の3軸でバランスの良いモデルと評価できます。

今後の展開：Nemotron 3 Ultra

NVIDIAは Nemotron 3 ファミリーの最上位モデルとしてNemotron 3 Ultra（500Bパラメータ・50Bアクティブ）を2026年前半リリース予定と発表しています。詳細はNemotron 3 Ultra プレビュー記事を参照。

よくある質問（FAQ）

Q Nemotron 3 Super はいつリリースされましたか？

2026年3月11日（米国時間）にリリースされました。Hugging Face・build.nvidia.com・主要クラウドで即日利用可能になりました。

Q 商用利用可能ですか？

はい。permissive license（open weights）で公開されており、商用プロダクトへの組み込みも可能です。詳細はライセンス本文を確認してください。

Q NemoClaw から呼び出せますか？

はい。NemoClaw のモデル選択UIから「Nemotron 3 Super」を選択するだけで切替可能。詳細はNemotron推論プロファイル解説を参照。

Q 必要なGPUは？

120Bパラメータのため、本格運用には NVIDIA H100/H200/B100/B200/GB200 等の高性能GPUが推奨。Blackwell + NVFP4 で最速。クラウド経由ならDGX Sparkローカル運用も検討可能。

Q 前世代 Nemotron Super との違いは？

スループット5倍、精度2倍、推論速度3倍、1M tokenコンテキスト。Mamba+Transformerのhybrid MoEアーキテクチャに刷新。

Q 日本語性能は？

NVIDIAは多言語サポートを公表していますが、日本語の詳細ベンチマークは2026年5月時点で限定的。社内文書で検証する場合はRAG構築ガイドと組み合わせて評価することを推奨します。

Q コストはどのくらい？

オープンウェイトなのでモデル自体は無料。実行コストは GPU 利用料に依存。NemoClaw導入費用の完全ガイドで詳細試算を確認してください。

NemoClawナビで最新のAIエージェント情報をチェック。