财经新闻 - 英伟达发力 #智能体Nemotron 3...

@caijing

2026-03-11 18:44:57 ·

英伟达发力 #智能体

Nemotron 3 Super推理时仅激活120亿活跃参数，原生支持100万token上下文窗口；

性能跃升来自三项架构创新：
混合Mamba-Transformer骨干网络、潜在专家混合模型（latent MoE）、多token预测（MTP）。

该模型在Blackwell平台以NVFP4精度运行，推理速度最高提升至Hopper 平台FP8的四倍，且精度无损失。

#Perplexity 成为首家接入该模型执行智能体任务的合作方。

英伟达发力 #智能体Nemotron 3 Super推理时仅激活120亿活跃参数，原生支持100万token上下文窗口；性能跃升来自三项架构创新：混合Mamba-Transformer骨干网络、潜在专家混合模型（latent MoE）、多token预测（MTP）。该模型在Blackwell平台以NVFP4精度运行，推理速度最高提升至Hopper 平台FP8的四倍，且精度无损失。#Perplexity 成为首家接入该模型执行智能体任务的合作方。

0 评论 ·0 分享 ·80 浏览