Gemini 3 = 稀疏 Mixture-of-Experts(MoE)Transformer + 原生多模态(文本/图像/音频/视频)+ 超长上下文(输入最多 1M token、输出 64k)+ RL 强化“多步推理/定理证明”的一整套栈,并且是用 Google 自家 TPU Pod + JAX + Pathways 从零训练出来的新模型。
#谷歌官方:不是 2.5 的微调版,而是从头训练的新一代架构。
这次 Gemini 3 的一个重要“元叙事”是:“不用 NVIDIA 也能在前沿”。
#报告 全文:https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ
#谷歌官方:不是 2.5 的微调版,而是从头训练的新一代架构。
这次 Gemini 3 的一个重要“元叙事”是:“不用 NVIDIA 也能在前沿”。
#报告 全文:https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ
Gemini 3 = 稀疏 Mixture-of-Experts(MoE)Transformer + 原生多模态(文本/图像/音频/视频)+ 超长上下文(输入最多 1M token、输出 64k)+ RL 强化“多步推理/定理证明”的一整套栈,并且是用 Google 自家 TPU Pod + JAX + Pathways 从零训练出来的新模型。#谷歌官方:不是 2.5 的微调版,而是从头训练的新一代架构。这次 Gemini 3 的一个重要“元叙事”是:“不用 NVIDIA 也能在前沿”。#报告 全文:https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ