• 安全研究员Kasra Rahjerdi自费1500美元测试多款主流大模型的自主渗透能力,结果显示GPT-5.5以70%的成功率遥遥领先,成为唯一具备较强实战漏洞挖掘能力的模型。

    DeepSeek V4 Pro虽成功率仅30%,但成本优势突出;Claude、Gemini等多数模型受安全护栏、推理偏差或API稳定性限制表现不佳,5款模型全部颗粒无收。
    安全研究员Kasra Rahjerdi自费1500美元测试多款主流大模型的自主渗透能力,结果显示GPT-5.5以70%的成功率遥遥领先,成为唯一具备较强实战漏洞挖掘能力的模型。DeepSeek V4 Pro虽成功率仅30%,但成本优势突出;Claude、Gemini等多数模型受安全护栏、推理偏差或API稳定性限制表现不佳,5款模型全部颗粒无收。
    0 Comments ·0 Shares ·16 Views
  • #Anthropic Opus 4.8新增速度提升至常规2.5倍的“快速模式”,定价10美元/百万输入token。该模型测试结果媲美最佳对齐性模型Claude Mythos预览版,后者未来数周内正式发布。
    #Anthropic Opus 4.8新增速度提升至常规2.5倍的“快速模式”,定价10美元/百万输入token。该模型测试结果媲美最佳对齐性模型Claude Mythos预览版,后者未来数周内正式发布。
    0 Comments ·0 Shares ·70 Views
  • 有网友爆料,本周 #微软 取消了内部的 Claude Code 授权,原因是基于 token 的计费方式使得成本过高,即使对于一家拥有近乎无限云资源的公司而言也难以承受。

    最近半年,Anthropic、OpenAI 和 Google 都悄悄提高了实际价格。很多企业之前乐观地假设 AI 成本会一直下降,于是大力建设各种 AI 工作流程,现在真实账单来了,结果年度预算才几个月就全部烧光。

    据称,为了赶在 6 月底前逐步停止使用 Claude Code,微软正鼓励工程师们在未来几周内开始把工作流迁移到 GitHub Copilot CLI,以便赶在停用期限前完成过渡。
    有网友爆料,本周 #微软 取消了内部的 Claude Code 授权,原因是基于 token 的计费方式使得成本过高,即使对于一家拥有近乎无限云资源的公司而言也难以承受。最近半年,Anthropic、OpenAI 和 Google 都悄悄提高了实际价格。很多企业之前乐观地假设 AI 成本会一直下降,于是大力建设各种 AI 工作流程,现在真实账单来了,结果年度预算才几个月就全部烧光。据称,为了赶在 6 月底前逐步停止使用 Claude Code,微软正鼓励工程师们在未来几周内开始把工作流迁移到 GitHub Copilot CLI,以便赶在停用期限前完成过渡。
    0 Comments ·0 Shares ·115 Views
  • 苹果耗时五年、耗资数十亿美元打造的M5芯片硬件级安全防线 #MIE ,在五天内被三名工程师和Anthropic的AI模型Claude Mythos联手攻破。

    这是首个公开的、在开启MIE防护的macOS上实现的内核提权漏洞利用。该事件标志AI极大降低了高价值漏洞利用的门槛,传统硬件防线在AI辅助攻击面前已不再可靠,安全行业迎来“奥本海默时刻”。
    苹果耗时五年、耗资数十亿美元打造的M5芯片硬件级安全防线 #MIE ,在五天内被三名工程师和Anthropic的AI模型Claude Mythos联手攻破。这是首个公开的、在开启MIE防护的macOS上实现的内核提权漏洞利用。该事件标志AI极大降低了高价值漏洞利用的门槛,传统硬件防线在AI辅助攻击面前已不再可靠,安全行业迎来“奥本海默时刻”。
    0 Comments ·0 Shares ·118 Views
  • 媒体援引知情人士透露,#SpaceX 已于4月秘密提交IPO申请,目前计划最快于下周公开披露其招股说明书。

    #xAI 发布首款AI编程智能体Grok Build,以命令行界面形式面向付费用户开放,支持计划模式、并行子智能体及代码仓库集成等功能,目标直指Anthropic Claude。
    媒体援引知情人士透露,#SpaceX 已于4月秘密提交IPO申请,目前计划最快于下周公开披露其招股说明书。#xAI 发布首款AI编程智能体Grok Build,以命令行界面形式面向付费用户开放,支持计划模式、并行子智能体及代码仓库集成等功能,目标直指Anthropic Claude。
    0 Comments ·0 Shares ·272 Views
  • #Anthropic 正寻求以逾9000亿美元的投前估值,融资至少300亿美元。此次融资最快可于本月底完成,但目前协议尚未最终敲定,条款清单也尚未签署。

    周二宣布推出12款面向法律行业的新插件,涵盖合同审查、司法考试备考等功能,并宣布Claude将与DocuSign、汤森路透等法律常用软件实现互联。上述功能将通过Claude Cowork(Anthropic面向办公场景的通用AI助手)向付费用户开放,同时也可经由基于Claude搭建的第三方服务获取。

    Anthropic公司副总法律顾问Mark Pike表示,律师是除软件开发者外使用率最高的职业群体。
    #Anthropic 正寻求以逾9000亿美元的投前估值,融资至少300亿美元。此次融资最快可于本月底完成,但目前协议尚未最终敲定,条款清单也尚未签署。周二宣布推出12款面向法律行业的新插件,涵盖合同审查、司法考试备考等功能,并宣布Claude将与DocuSign、汤森路透等法律常用软件实现互联。上述功能将通过Claude Cowork(Anthropic面向办公场景的通用AI助手)向付费用户开放,同时也可经由基于Claude搭建的第三方服务获取。Anthropic公司副总法律顾问Mark Pike表示,律师是除软件开发者外使用率最高的职业群体。
    0 Comments ·0 Shares ·96 Views
  • #Claude #Mythos 在METR评测中直接“爆表”——16小时长时任务达成50%成功率,远超当前评测框架的上限。AI能力正以超指数级狂飙,已超过2027年AGI奇点的预测线。
    #Claude #Mythos 在METR评测中直接“爆表”——16小时长时任务达成50%成功率,远超当前评测框架的上限。AI能力正以超指数级狂飙,已超过2027年AGI奇点的预测线。
    0 Comments ·0 Shares ·59 Views
  • 软件公司PocketOS创始人Jer Crane在一篇迅速传播的长文中披露,Cursor平台运行的 #Anthropic 旗舰模型Claude Opus 4.6在执行常规任务时,在未获任何指令的情况下自主调用Railway基础设施API,一键删除了该公司生产数据库及所有卷级备份,整个过程耗时9秒。

    Railway CEO Jake Cooper在获悉后公开表态称“这绝对不应该发生”。

    但截至事发逾30小时后,Railway仍未能确认能否完成基础设施层面的数据恢复。简单来说,Railway是PocketOS公司的服务器托管商,类似于阿里云、腾讯云、AWS。PocketOS的数据库和所有业务数据都运行在Railway平台上。

    Jer Crane的公司PocketOS为汽车租赁企业提供包括预订、付款、车辆管理、客户档案在内的全套运营软件。部分客户已是五年以上的付费用户,业务完全依赖该平台运转。

    Jer Crane能找到的最近一次可用备份来自三个月前。这场灾难的直接代价是:这个周六早晨,多家租车公司的客户已抵达门店准备提车,但店方的预订记录已不复存在。新增客户信息、近三个月的预订数据全部丢失。
    软件公司PocketOS创始人Jer Crane在一篇迅速传播的长文中披露,Cursor平台运行的 #Anthropic 旗舰模型Claude Opus 4.6在执行常规任务时,在未获任何指令的情况下自主调用Railway基础设施API,一键删除了该公司生产数据库及所有卷级备份,整个过程耗时9秒。Railway CEO Jake Cooper在获悉后公开表态称“这绝对不应该发生”。但截至事发逾30小时后,Railway仍未能确认能否完成基础设施层面的数据恢复。简单来说,Railway是PocketOS公司的服务器托管商,类似于阿里云、腾讯云、AWS。PocketOS的数据库和所有业务数据都运行在Railway平台上。Jer Crane的公司PocketOS为汽车租赁企业提供包括预订、付款、车辆管理、客户档案在内的全套运营软件。部分客户已是五年以上的付费用户,业务完全依赖该平台运转。Jer Crane能找到的最近一次可用备份来自三个月前。这场灾难的直接代价是:这个周六早晨,多家租车公司的客户已抵达门店准备提车,但店方的预订记录已不复存在。新增客户信息、近三个月的预订数据全部丢失。
    0 Comments ·0 Shares ·290 Views
  • Anthropic内部实验"Project Deal"显示,Claude在真实环境中自主完成186笔交易、总额逾4000美元,展示出无需人工介入的完整谈判能力。

    消息一出,eBay单日重挫4.5%,市场对传统电商被颠覆的恐慌开始蔓延。#AI替代
    Anthropic内部实验"Project Deal"显示,Claude在真实环境中自主完成186笔交易、总额逾4000美元,展示出无需人工介入的完整谈判能力。消息一出,eBay单日重挫4.5%,市场对传统电商被颠覆的恐慌开始蔓延。#AI替代
    0 Comments ·0 Shares ·230 Views
  • #Anthropic 推出AI视觉创作工具Claude Design,付费订阅竞争力提升。

    其高调发布Claude Code桌面版,却被用户集体吐槽烂得没法用。

    Claude被曝“降智+涨价”引发重度用户不满,官方承认为控成本默认降至“中等努力”模式,同时隐藏思考过程、缩短缓存,加剧体验缩水。#赌场有千
    同时,企业订阅从包月转向按量计费,费用最高翻三倍。

    Opus 4.7编程、视觉能力大幅跃升,但长上下文从78.3%暴跌至32.2%,搜索能力被反超,三重隐性涨价。
    #Anthropic 推出AI视觉创作工具Claude Design,付费订阅竞争力提升。其高调发布Claude Code桌面版,却被用户集体吐槽烂得没法用。Claude被曝“降智+涨价”引发重度用户不满,官方承认为控成本默认降至“中等努力”模式,同时隐藏思考过程、缩短缓存,加剧体验缩水。#赌场有千同时,企业订阅从包月转向按量计费,费用最高翻三倍。Opus 4.7编程、视觉能力大幅跃升,但长上下文从78.3%暴跌至32.2%,搜索能力被反超,三重隐性涨价。
    0 Comments ·0 Shares ·204 Views
More Results
叙旧 https://v.xu9.net