Claude玩宝可梦，卡关就「装死」重启，大模型：逃避可耻但有用

来源：网络分享编辑：引流技巧时间：2025-09-02

声明:本文来自于微信公众号机器之心，作者:佳琪、蛋酱。

半个月前，Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude3.7Sonnet。

它现在已经聪明到有点吓人了，玩游戏卡关的时候，为了自救，它选择了「自杀」来回到上一段剧情。

这js操作，怕不是 Claude 已经掌握了人类切电源重启的精髓?

事情是这样的，Claude3.7Sonnet 是全球首个混合推理模型，它拥有两幅面孔，日常任务交给普通模式，需要动脑的调研、编程问题交给拓展模式。

为了展示 Claude3.7Sonnet 的推理能力到底有多强，Anthropic 官方给 Claude 配备了知识库、看懂屏幕像素和操作按键的能力，让 Claude 在拓展模式玩宝可梦。

通过对数学基准的广泛分析，最终他们发现了这些过度思考模式:（1）对提高准确率的贡献微乎其微;(2)推理策略缺乏多样性;(3)在简单问题上出现频率更高。

而这一切观察指向了两个未来探索方向:

1. 自适应调控策略:开发让模型根据问题复杂程度动态调整推理深度的机制，更智能地分配计算资源;

2. 更精细的效率评http://估指标:设计能够覆盖更广泛推理轨迹的指标，从而更全面地评估模型的思考效率。

这或许能为 Claude 玩宝可梦时的反常行为提供一些解决思路。

关于大模型「过度思考」背编程客栈后的原理，还有很多研究者从不同方向进行了解读。具体可参考以下推荐阅读文章: