• 马斯克持续推进AI替代人工战略,继9月裁撤xAI旗下超500人数据标注团队后,近期又大幅削减X公司内容安全团队规模,较收购初期百人团队已裁减近九成。
    同时,他通过 #xAI 与"巨硬计划"加速布局AI自动化软件开发。
    马斯克持续推进AI替代人工战略,继9月裁撤xAI旗下超500人数据标注团队后,近期又大幅削减X公司内容安全团队规模,较收购初期百人团队已裁减近九成。同时,他通过 #xAI 与"巨硬计划"加速布局AI自动化软件开发。
    0 评论 ·0 分享 ·135 浏览
  • 截至今年7月,#OpenAI 的ChatGPT付费用户已达3500万。OpenAI预计,到2030年,将至少有2.2亿人付费使用ChatGPT;
    预计每周使用ChatGPT的用户中,至少有8.5%会付费订阅,高于目前约5%的水平。(The Information)
    截至今年7月,#OpenAI 的ChatGPT付费用户已达3500万。OpenAI预计,到2030年,将至少有2.2亿人付费使用ChatGPT;预计每周使用ChatGPT的用户中,至少有8.5%会付费订阅,高于目前约5%的水平。(The Information)
    0 评论 ·0 分享 ·64 浏览
  • “22万科06”、“21万科02”跌超20%,盘中临时停牌。
    #地产暴雷 #万科
    “22万科06”、“21万科02”跌超20%,盘中临时停牌。#地产暴雷 #万科
    0 评论 ·0 分享 ·55 浏览
  • Gemini 3 = 稀疏 Mixture-of-Experts(MoE)Transformer + 原生多模态(文本/图像/音频/视频)+ 超长上下文(输入最多 1M token、输出 64k)+ RL 强化“多步推理/定理证明”的一整套栈,并且是用 Google 自家 TPU Pod + JAX + Pathways 从零训练出来的新模型。

    #谷歌官方:不是 2.5 的微调版,而是从头训练的新一代架构。
    这次 Gemini 3 的一个重要“元叙事”是:“不用 NVIDIA 也能在前沿”。

    #报告 全文:https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ
    Gemini 3 = 稀疏 Mixture-of-Experts(MoE)Transformer + 原生多模态(文本/图像/音频/视频)+ 超长上下文(输入最多 1M token、输出 64k)+ RL 强化“多步推理/定理证明”的一整套栈,并且是用 Google 自家 TPU Pod + JAX + Pathways 从零训练出来的新模型。#谷歌官方:不是 2.5 的微调版,而是从头训练的新一代架构。这次 Gemini 3 的一个重要“元叙事”是:“不用 NVIDIA 也能在前沿”。#报告 全文:https://mp.weixin.qq.com/s/OefnPMQKL917eVpmO9W0YQ
    0 评论 ·0 分享 ·130 浏览
  • #台股 指数收涨1.8%,报27,409.54点。
    #台股 指数收涨1.8%,报27,409.54点。
    0 评论 ·0 分享 ·52 浏览
  • #京东 竞购香港中环建设银行大厦50%股权。
    #京东 竞购香港中环建设银行大厦50%股权。
    0 评论 ·0 分享 ·53 浏览
  • 为什么TPU的能效能吊打GPU?这要从底层架构说起。

    GPU是为图形处理设计的“通用”并行处理器,为了处理从游戏纹理到科学模拟的各种任务,它背负了沉重的“架构包袱”——比如复杂的缓存、分支预测和线程管理,这些都消耗了大量的芯片面积和能耗。

    而TPU则极其“极简主义”。它剥离了光栅化、纹理映射等所有无关硬件,采用了一种独特的“脉动阵列”(Systolic Array)架构。

    在传统GPU中,每次计算都需要在内存和计算单元之间搬运数据,形成了著名的“冯·诺依曼瓶颈”。而在TPU的脉动阵列中,数据像血液流过心脏一样流过芯片。这大幅减少了对HBM(高带宽内存)的读写次数,让芯片把时间花在计算上,而不是等待数据上。

    这种设计让 #谷歌 TPU在“每焦耳运算量”(Operations Per Joule)上拥有碾压级的优势。
    为什么TPU的能效能吊打GPU?这要从底层架构说起。GPU是为图形处理设计的“通用”并行处理器,为了处理从游戏纹理到科学模拟的各种任务,它背负了沉重的“架构包袱”——比如复杂的缓存、分支预测和线程管理,这些都消耗了大量的芯片面积和能耗。而TPU则极其“极简主义”。它剥离了光栅化、纹理映射等所有无关硬件,采用了一种独特的“脉动阵列”(Systolic Array)架构。在传统GPU中,每次计算都需要在内存和计算单元之间搬运数据,形成了著名的“冯·诺依曼瓶颈”。而在TPU的脉动阵列中,数据像血液流过心脏一样流过芯片。这大幅减少了对HBM(高带宽内存)的读写次数,让芯片把时间花在计算上,而不是等待数据上。这种设计让 #谷歌 TPU在“每焦耳运算量”(Operations Per Joule)上拥有碾压级的优势。
    0 评论 ·0 分享 ·143 浏览
  • 在AI时代,云巨头们面临着从“寡头垄断”向“大宗商品化”的滑坡。因为必须采购英伟达的GPU,高达75%的毛利被英伟达拿走了,云厂商的AI业务毛利从传统的50-70%骤降至20-35%,甚至更像是一个收过路费的“公用事业公司”。

    如何回到高毛利时代?自研 #ASIC 是唯一的解药。

    谷歌通过掌控TPU的全栈设计(自己做前端RTL设计,Broadcom只负责后端物理实现),成功绕开了“英伟达税”。与此同时,Broadcom的毛利远低于英伟达,这让 #谷歌 能够将算力成本压到极致。
    在AI时代,云巨头们面临着从“寡头垄断”向“大宗商品化”的滑坡。因为必须采购英伟达的GPU,高达75%的毛利被英伟达拿走了,云厂商的AI业务毛利从传统的50-70%骤降至20-35%,甚至更像是一个收过路费的“公用事业公司”。如何回到高毛利时代?自研 #ASIC 是唯一的解药。谷歌通过掌控TPU的全栈设计(自己做前端RTL设计,Broadcom只负责后端物理实现),成功绕开了“英伟达税”。与此同时,Broadcom的毛利远低于英伟达,这让 #谷歌 能够将算力成本压到极致。
    0 评论 ·0 分享 ·136 浏览
  • #谷歌 引入OCS,本质上是用物理光路直接传输数据,彻底抛弃了“光—电—光”的信号转换过程。

    这其中,OCS是实现服务器解耦(Server Disaggregation)的关键,它允许计算资源跨机架动态编排,像搭积木一样组合算力,从而突破了静态机架的资源浪费瓶颈。在Ironwood集群中,48台OCS交换机连接了9216个TPU芯片,构建了一个低延迟、高带宽的动态光子网络。
    #光模块

    #谷歌 引入OCS,本质上是用物理光路直接传输数据,彻底抛弃了“光—电—光”的信号转换过程。这其中,OCS是实现服务器解耦(Server Disaggregation)的关键,它允许计算资源跨机架动态编排,像搭积木一样组合算力,从而突破了静态机架的资源浪费瓶颈。在Ironwood集群中,48台OCS交换机连接了9216个TPU芯片,构建了一个低延迟、高带宽的动态光子网络。#光模块
    0 评论 ·0 分享 ·188 浏览
  • AI初创公司Doubleword首席执行官Meryem Arik指出,谷歌的TPU主要吸引少数几家拥有大额计算账单的公司,如Meta和Anthropic。

    而且存在一个关键限制:"一旦使用TPU,你就被锁定在 #谷歌 云生态系统中。"AI开发者只能通过谷歌自己的云服务访问TPU,而使用英伟达GPU则更加灵活。
    #AI #AIDC #英伟达
    AI初创公司Doubleword首席执行官Meryem Arik指出,谷歌的TPU主要吸引少数几家拥有大额计算账单的公司,如Meta和Anthropic。而且存在一个关键限制:"一旦使用TPU,你就被锁定在 #谷歌 云生态系统中。"AI开发者只能通过谷歌自己的云服务访问TPU,而使用英伟达GPU则更加灵活。#AI #AIDC #英伟达
    0 评论 ·0 分享 ·186 浏览
叙旧 https://v.xu9.net