#OpenAI GPT-5.2在深度推理与代码生成上展现出“强到离谱”的能力,其遵循复杂指令的意愿和任务完成度显著超越前代。
然而,评测同时指出,其标准“思考”模式速度过慢,严重影响了日常使用体验,导致用户不得不在速度与深度之间根据任务需求切换不同模型。
Reddit用户集体吐槽 GPT-5.2:太平淡、安全过度,把成年人当幼儿园小孩对待。最致命的是“不通人性”。有人倾诉“我也会恐慌发作”,它回“很高兴听到这个消息!”SimpleBench 常识测试得分甚至没打过一年前推出的Claude Sonnet 3.7,被批“不像升级,反而像倒退”。
然而,评测同时指出,其标准“思考”模式速度过慢,严重影响了日常使用体验,导致用户不得不在速度与深度之间根据任务需求切换不同模型。
Reddit用户集体吐槽 GPT-5.2:太平淡、安全过度,把成年人当幼儿园小孩对待。最致命的是“不通人性”。有人倾诉“我也会恐慌发作”,它回“很高兴听到这个消息!”SimpleBench 常识测试得分甚至没打过一年前推出的Claude Sonnet 3.7,被批“不像升级,反而像倒退”。
#OpenAI GPT-5.2在深度推理与代码生成上展现出“强到离谱”的能力,其遵循复杂指令的意愿和任务完成度显著超越前代。然而,评测同时指出,其标准“思考”模式速度过慢,严重影响了日常使用体验,导致用户不得不在速度与深度之间根据任务需求切换不同模型。Reddit用户集体吐槽 GPT-5.2:太平淡、安全过度,把成年人当幼儿园小孩对待。最致命的是“不通人性”。有人倾诉“我也会恐慌发作”,它回“很高兴听到这个消息!”SimpleBench 常识测试得分甚至没打过一年前推出的Claude Sonnet 3.7,被批“不像升级,反而像倒退”。