• 6月2日至5日,台北国际电脑展(COMPUTEX 2026)将以“AI together”为主题举行,市场焦点正迅速转向英伟达的机架级系统设计及先进封装进展。

    #英伟达 CEO 黄仁勋将全面展示以Rubin GPU和Vera CPU为核心的新一代AI算力架构,进一步巩固其在AI基础设施领域的统治地位。

    预计将展示NVL、LPU、Vera CPU、BlueField以及NVSwitch机架的组合,目标是为未来的“AI工厂”提供最低的单Token成本。

    在封装设计方面,针对Rubin Ultra版本,英伟达需要在2027年采用新的光罩以引入HBM4e内存。为保持良好的芯片良率并解决翘曲问题,Rubin Ultra预计将维持单封装两颗裸片(2-die)的设计,而非此前传言的四颗。

    供应链调研显示,台积电正在为Vera CPU分配额外的CoWoS-R产能和3纳米晶圆。

    Vera CPU的最终客户将包括微软、Meta、CoreWeave以及甲骨文等大型科技企业和云服务提供商。#报告
    6月2日至5日,台北国际电脑展(COMPUTEX 2026)将以“AI together”为主题举行,市场焦点正迅速转向英伟达的机架级系统设计及先进封装进展。#英伟达 CEO 黄仁勋将全面展示以Rubin GPU和Vera CPU为核心的新一代AI算力架构,进一步巩固其在AI基础设施领域的统治地位。预计将展示NVL、LPU、Vera CPU、BlueField以及NVSwitch机架的组合,目标是为未来的“AI工厂”提供最低的单Token成本。在封装设计方面,针对Rubin Ultra版本,英伟达需要在2027年采用新的光罩以引入HBM4e内存。为保持良好的芯片良率并解决翘曲问题,Rubin Ultra预计将维持单封装两颗裸片(2-die)的设计,而非此前传言的四颗。供应链调研显示,台积电正在为Vera CPU分配额外的CoWoS-R产能和3纳米晶圆。Vera CPU的最终客户将包括微软、Meta、CoreWeave以及甲骨文等大型科技企业和云服务提供商。#报告
    0 评论 0 分享 223 浏览
  • 在GTC 2026主题演讲结束后,英伟达CEO黄仁勋接受了Stratechery创始人Ben Thompson的专访:

    AI在过去一年跨越了一个关键门槛——推理能力的提升使模型首次开始产生真实的经济价值,而编程代理的爆发则是这一转变最清晰的体现。

    生成式AI早期因幻觉问题难以商业化,而推理能力的引入使模型得以通过反思、检索与搜索实现"落地",进而从提供信息跃升为真正完成任务。"搜索是一项没有人付费的服务,原因在于获取信息的门槛不足以让人掏钱。

    在技术层面,由Vera Rubin GPU处理高FLOP的注意力计算,由Groq的 #LPU 架构承担需要极高token速率与极低延迟的部分。

    黄仁勋将AI代理的工具使用分为两类:一类是结构化工具,包括CLI、API和数据库查询;另一类是非结构化工具,包括需要模型通过多模态感知操作网页界面的PC端应用。#英伟达 在两条路径上均有布局。
    在GTC 2026主题演讲结束后,英伟达CEO黄仁勋接受了Stratechery创始人Ben Thompson的专访:AI在过去一年跨越了一个关键门槛——推理能力的提升使模型首次开始产生真实的经济价值,而编程代理的爆发则是这一转变最清晰的体现。生成式AI早期因幻觉问题难以商业化,而推理能力的引入使模型得以通过反思、检索与搜索实现"落地",进而从提供信息跃升为真正完成任务。"搜索是一项没有人付费的服务,原因在于获取信息的门槛不足以让人掏钱。在技术层面,由Vera Rubin GPU处理高FLOP的注意力计算,由Groq的 #LPU 架构承担需要极高token速率与极低延迟的部分。黄仁勋将AI代理的工具使用分为两类:一类是结构化工具,包括CLI、API和数据库查询;另一类是非结构化工具,包括需要模型通过多模态感知操作网页界面的PC端应用。#英伟达 在两条路径上均有布局。
    0 评论 0 分享 112 浏览
  • 华尔街点评GTC: #英伟达 GTC大会释放核心信号:AI算力的商业逻辑正在发生根本性重构——Token已成为新的大宗商品,而算力即收入。

    美银认为,Blackwell系统相较上一代Hopper已实现每Token成本降低高达35倍,即将推出的Rubin系列有望在此基础上再降低2至35倍,这种持续压缩的Token成本曲线,是驱动需求规模化扩张的根本动力。

    高盛快评,价值高达1万亿美元的数据中心 #AIDC 营收订单,远超市场普遍预期,有助于消除投资者对于AI资本开支可能已达“峰值”的担忧。其次,英伟达推出了Groq的LPX机架系统,此举进一步巩固了对推理市场的战略承诺。

    郭明錤:2026至2027年 #LPU 出货量预计达400至500万台,较历史年产量暴增10倍。机架密度从64跃至256单元,背后的 #PCB 供应链同步迎来新周期——WUS印制电路或成最大赢家。
    华尔街点评GTC: #英伟达 GTC大会释放核心信号:AI算力的商业逻辑正在发生根本性重构——Token已成为新的大宗商品,而算力即收入。美银认为,Blackwell系统相较上一代Hopper已实现每Token成本降低高达35倍,即将推出的Rubin系列有望在此基础上再降低2至35倍,这种持续压缩的Token成本曲线,是驱动需求规模化扩张的根本动力。高盛快评,价值高达1万亿美元的数据中心 #AIDC 营收订单,远超市场普遍预期,有助于消除投资者对于AI资本开支可能已达“峰值”的担忧。其次,英伟达推出了Groq的LPX机架系统,此举进一步巩固了对推理市场的战略承诺。郭明錤:2026至2027年 #LPU 出货量预计达400至500万台,较历史年产量暴增10倍。机架密度从64跃至256单元,背后的 #PCB 供应链同步迎来新周期——WUS印制电路或成最大赢家。
    0 评论 0 分享 167 浏览
叙旧 https://v.xu9.net