#Claude #Mythos 在METR评测中直接“爆表”——16小时长时任务达成50%成功率,远超当前评测框架的上限。AI能力正以超指数级狂飙,已超过2027年AGI奇点的预测线。
#Claude #Mythos 在METR评测中直接“爆表”——16小时长时任务达成50%成功率,远超当前评测框架的上限。AI能力正以超指数级狂飙,已超过2027年AGI奇点的预测线。
0 Comments ·0 Shares ·59 Views
叙旧 https://v.xu9.net