Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用
            	来源:网络分享
                编辑:引流技巧
                时间:2025-09-02
            	
			
            
声明:本文来自于微信公众号 机器之心,作者:佳琪、蛋酱。
半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude3.7Sonnet。
它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择了「自杀」来回到上一段剧情。
这js操作,怕不是 Claude 已经掌握了人类切电源重启的精髓?
事情是这样的,Claude3.7Sonnet 是全球首个混合推理模型,它拥有两幅面孔,日常任务交给普通模式,需要动脑的调研、编程问题交给拓展模式。
为了展示 Claude3.7Sonnet 的推理能力到底有多强,Anthropic 官方给 Claude 配备了知识库、看懂屏幕像素和操作按键的能力,让 Claude 在拓展模式玩宝可梦。

通过对数学基准的广泛分析,最终他们发现了这些过度思考模式:(1)对提高准确率的贡献微乎其微;(2)推理策略缺乏多样性;(3)在简单问题上出现频率更高。
而这一切观察指向了两个未来探索方向:
1. 自适应调控策略:开发让模型根据问题复杂程度动态调整推理深度的机制,更智能地分配计算资源;
2. 更精细的效率评http://估指标:设计能够覆盖更广泛推理轨迹的指标,从而更全面地评估模型的思考效率。
这或许能为 Claude 玩宝可梦时的反常行为提供一些解决思路。
关于大模型「过度思考」背编程客栈后的原理,还有很多研究者从不同方向进行了解读。具体可参考以下推荐阅读文章:
- 《从 o1-mini 到 DeepSeek-R1,万字长文带你读懂推理模型的历史与技术》
 - 《两万字长文深度解密 DeepSeek-R1、Kimi1.5,强推理模型凭什么火出圈?》
 


相关文章:
相关推荐:
栏目分类
            
        
最新文章
            
        
热门文章
            
        

