通过为大型先进混合专家模型(MoE)定制的优化技术,Mistral Large 3在英伟达GB200 NVL72系统上实现了同类最佳性能,相比前代H200芯片的性能提升10倍,每MW能耗可实现每秒超过500万token的处理速度。Ministral 3系列小模型在英伟达RTX 5090 GPU上可实现每秒最高385个token的推理速度。
英伟达支持的初创公司Luma AI完成9亿美元融资,估值突破40亿美元,宣布在伦敦扩张,计划招聘200名员工。
通过为大型先进混合专家模型(MoE)定制的优化技术,Mistral Large 3在英伟达GB200 NVL72系统上实现了同类最佳性能,相比前代H200芯片的性能提升10倍,每MW能耗可实现每秒超过500万token的处理速度。Ministral 3系列小模型在英伟达RTX 5090 GPU上可实现每秒最高385个token的推理速度。英伟达支持的初创公司Luma AI完成9亿美元融资,估值突破40亿美元,宣布在伦敦扩张,计划招聘200名员工。