#Claude #Mythos 在METR评测中直接“爆表”——16小时长时任务达成50%成功率,远超当前评测框架的上限。AI能力正以超指数级狂飙,已超过2027年AGI奇点的预测线。
#Claude #Mythos 在METR评测中直接“爆表”——16小时长时任务达成50%成功率,远超当前评测框架的上限。AI能力正以超指数级狂飙,已超过2027年AGI奇点的预测线。
0 评论 ·0 分享 ·59 浏览
叙旧 https://v.xu9.net