财经新闻 - Gemini 3 = 稀疏 Mixture-of-Experts（MoE）Transformer +...

@caijing

2025-11-25 19:58:11 ·

Gemini 3 = 稀疏 Mixture-of-Experts（MoE）Transformer + 原生多模态（文本/图像/音频/视频）+ 超长上下文（输入最多 1M token、输出 64k）+ RL 强化“多步推理/定理证明”的一整套栈，并且是用 Google 自家 TPU Pod + JAX + Pathways 从零训练出来的新模型。

#谷歌官方：不是 2.5 的微调版，而是从头训练的新一代架构。
这次 Gemini 3 的一个重要“元叙事”是：“不用 NVIDIA 也能在前沿”。

#报告全文：https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ

Gemini 3 = 稀疏 Mixture-of-Experts（MoE）Transformer + 原生多模态（文本/图像/音频/视频）+ 超长上下文（输入最多 1M token、输出 64k）+ RL 强化“多步推理/定理证明”的一整套栈，并且是用 Google 自家 TPU Pod + JAX + Pathways 从零训练出来的新模型。#谷歌官方：不是 2.5 的微调版，而是从头训练的新一代架构。这次 Gemini 3 的一个重要“元叙事”是：“不用 NVIDIA 也能在前沿”。#报告全文：https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ

0 评论 ·0 分享 ·130 浏览