発表概要
NVIDIAは2026年3月11日(米国時間)、エージェント型AI向けに最適化された新しいオープン推論モデル「Nemotron 3 Super」をリリースしました。Nemotron 3 ファミリーの中核モデルで、2025年12月発表のNano(最小・最速)に続く第2弾。120Bパラメータ(うち12Bアクティブ)のhybrid mixture-of-experts設計で、Mambaレイヤーと Transformerレイヤーを組み合わせた新アーキテクチャを採用しています。
NemoClaw(NVIDIAのエンタープライズAIエージェント基盤)上でも標準サポートされ、本稿執筆時点でbuild.nvidia.com・Perplexity・OpenRouter・Hugging Face・Google Cloud Vertex AI・Oracle Cloud Infrastructure 等で利用開始されています。
主要スペック・性能数値
| 項目 | Nemotron 3 Super | 前世代(Nemotron Super)比 |
|---|---|---|
| 総パラメータ | 120B | 同等規模 |
| アクティブパラメータ | 12B | — |
| スループット | 5倍向上 | +400% |
| 精度 | 最大2倍向上 | +100% |
| 推論速度 | 3倍高速(multi-token prediction) | +200% |
| Blackwell NVFP4 vs Hopper FP8 | 4倍高速 | +300% |
| コンテキスト窓 | 1,000,000 token | 1Mに拡張 |
| アーキテクチャ | Mamba + Transformer hybrid MoE | 新規 |
| ライセンス | Open weights(permissive) | 商用利用可 |
特に注目すべきは NVFP4精度のサポートで、Blackwell GPU上で FP8 on Hopper の4倍の推論速度を実現します。エンタープライズPoCで重視される1M tokenコンテキストも大型ドキュメント解析・長期会話エージェントの実用化に直結します。
ベンチマーク:DeepResearch Bench I/II で首位
独立ベンチマークサイト Artificial Analysis では効率性とオープン性の両軸で首位を獲得。さらに DeepResearch Bench I・II の両方で 1位を記録し、Anthropic Claude・OpenAI GPT・Meta Llama 等のクローズド/オープン両陣営を上回るスコアを示しました。
DeepResearch Benchは深層リサーチ・複数情報源統合タスクの精度を評価するエージェント特化ベンチマーク。商用エンタープライズ案件で重要視される「複数文書を横断して結論を出す」能力を測定します。
ダウンロード・利用可能プラットフォーム
2026年3月リリース時点で以下から利用可能:
- build.nvidia.com(NVIDIA NIM経由)
- Hugging Face(open weights)
- Perplexity / OpenRouter(API経由)
- Google Cloud Vertex AI / Oracle Cloud Infrastructure
- Coreweave / Crusoe / Nebius / Together AI
- Baseten / Cloudflare / DeepInfra / Fireworks AI 等
NemoClaw からの利用は標準のモデル選択UIから「Nemotron 3 Super」を選択するだけで切替可能です。詳細はNemotron推論プロファイル解説を参照。
国内エンタープライズ導入の観点
Nemotron 3 Super は商用利用可のオープンウェイトであり、自社プライベートクラウド・オンプレ環境での運用が可能です。これは医療・金融・公共セクター等のデータ主権要件が厳しい業界にとって決定的なメリットです。
1M tokenコンテキストは契約書解析・カルテ統合・規制文書照合などの本番タスクを単一推論で完結させる能力を持ち、従来複数回の RAG が必要だったワークフローを簡略化できます。NemoClaw導入のROI計算方法と合わせて投資判断の参考にしてください。
競合モデルとの位置付け
| モデル | パラメータ | コンテキスト | 商用利用 | 主な強み |
|---|---|---|---|---|
| Nemotron 3 Super | 120B (12B active) | 1M token | ◎ permissive | 5x throughput・DeepResearch首位 |
| Llama 3.3 70B | 70B | 128K | ○ Meta license | OSS定番・Instruct |
| Mistral Large 2 | 123B | 128K | △ Research only | 多言語 |
| DeepSeek V3 | 671B (37B active) | 128K | ○ MIT | コスト効率 |
| Qwen 2.5 72B | 72B | 128K | ○ Apache 2.0 | 中国市場 |
パラメータ数で見ると DeepSeek V3 (671B) が最大ですが、Nemotron 3 Super はアクティブ12Bで効率を保ちつつ DeepResearch Bench 首位という、「効率×精度×オープン性」の3軸でバランスの良いモデルと評価できます。
今後の展開:Nemotron 3 Ultra
NVIDIAは Nemotron 3 ファミリーの最上位モデルとしてNemotron 3 Ultra(500Bパラメータ・50Bアクティブ)を2026年前半リリース予定と発表しています。詳細はNemotron 3 Ultra プレビュー記事を参照。