英伟达发力 #智能体
Nemotron 3 Super推理时仅激活120亿活跃参数,原生支持100万token上下文窗口;
性能跃升来自三项架构创新:
混合Mamba-Transformer骨干网络、潜在专家混合模型(latent MoE)、多token预测(MTP)。
该模型在Blackwell平台以NVFP4精度运行,推理速度最高提升至Hopper 平台FP8的四倍,且精度无损失。
#Perplexity 成为首家接入该模型执行智能体任务的合作方。
Nemotron 3 Super推理时仅激活120亿活跃参数,原生支持100万token上下文窗口;
性能跃升来自三项架构创新:
混合Mamba-Transformer骨干网络、潜在专家混合模型(latent MoE)、多token预测(MTP)。
该模型在Blackwell平台以NVFP4精度运行,推理速度最高提升至Hopper 平台FP8的四倍,且精度无损失。
#Perplexity 成为首家接入该模型执行智能体任务的合作方。
英伟达发力 #智能体Nemotron 3 Super推理时仅激活120亿活跃参数,原生支持100万token上下文窗口;性能跃升来自三项架构创新:混合Mamba-Transformer骨干网络、潜在专家混合模型(latent MoE)、多token预测(MTP)。该模型在Blackwell平台以NVFP4精度运行,推理速度最高提升至Hopper 平台FP8的四倍,且精度无损失。#Perplexity 成为首家接入该模型执行智能体任务的合作方。