Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用
来源:网络分享
编辑:引流技巧
时间:2025-09-02

声明:本文来自于微信公众号 机器之心,作者:佳琪、蛋酱。
半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude3.7Sonnet。
它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择了「自杀」来回到上一段剧情。
这js操作,怕不是 Claude 已经掌握了人类切电源重启的精髓?
事情是这样的,Claude3.7Sonnet 是全球首个混合推理模型,它拥有两幅面孔,日常任务交给普通模式,需要动脑的调研、编程问题交给拓展模式。
为了展示 Claude3.7Sonnet 的推理能力到底有多强,Anthropic 官方给 Claude 配备了知识库、看懂屏幕像素和操作按键的能力,让 Claude 在拓展模式玩宝可梦。
通过对数学基准的广泛分析,最终他们发现了这些过度思考模式:(1)对提高准确率的贡献微乎其微;(2)推理策略缺乏多样性;(3)在简单问题上出现频率更高。
而这一切观察指向了两个未来探索方向:
1. 自适应调控策略:开发让模型根据问题复杂程度动态调整推理深度的机制,更智能地分配计算资源;
2. 更精细的效率评http://估指标:设计能够覆盖更广泛推理轨迹的指标,从而更全面地评估模型的思考效率。
这或许能为 Claude 玩宝可梦时的反常行为提供一些解决思路。
关于大模型「过度思考」背编程客栈后的原理,还有很多研究者从不同方向进行了解读。具体可参考以下推荐阅读文章:
- 《从 o1-mini 到 DeepSeek-R1,万字长文带你读懂推理模型的历史与技术》
- 《两万字长文深度解密 DeepSeek-R1、Kimi1.5,强推理模型凭什么火出圈?》


相关文章:
相关推荐:
栏目分类

最新文章

热门文章
