设为首页 - 加入收藏
广告 1000x90
您的当前位置:主页 > 微商引流 > 微商资讯 > 正文

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

来源:网络分享 编辑:引流技巧 时间:2025-09-02

声明:本文来自于微信公众号 机器之心,作者:佳琪、蛋酱。

半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude3.7Sonnet。

它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择了「自杀」来回到上一段剧情。

这js操作,怕不是 Claude 已经掌握了人类切电源重启的精髓?

事情是这样的,Claude3.7Sonnet 是全球首个混合推理模型,它拥有两幅面孔,日常任务交给普通模式,需要动脑的调研、编程问题交给拓展模式。

为了展示 Claude3.7Sonnet 的推理能力到底有多强,Anthropic 官方给 Claude 配备了知识库、看懂屏幕像素和操作按键的能力,让 Claude 在拓展模式玩宝可梦。

通过对数学基准的广泛分析,最终他们发现了这些过度思考模式:(1)对提高准确率的贡献微乎其微;(2)推理策略缺乏多样性;(3)在简单问题上出现频率更高。

而这一切观察指向了两个未来探索方向:

1. 自适应调控策略:开发让模型根据问题复杂程度动态调整推理深度的机制,更智能地分配计算资源;

2. 更精细的效率评http://估指标:设计能够覆盖更广泛推理轨迹的指标,从而更全面地评估模型的思考效率。

这或许能为 Claude 玩宝可梦时的反常行为提供一些解决思路。

关于大模型「过度思考」背编程客栈后的原理,还有很多研究者从不同方向进行了解读。具体可参考以下推荐阅读文章:

  • 《从 o1-mini 到 DeepSeek-R1,万字长文带你读懂推理模型的历史与技术》
  • 《两万字长文深度解密 DeepSeek-R1、Kimi1.5,强推理模型凭什么火出圈?》

相关推荐:

栏目分类

微商引流技巧网 www.yinliujiqiao.com 联系QQ:1716014443 邮箱:1716014443@qq.com

Copyright © 2019-2024 强大传媒 吉ICP备19000289号-9 网站地图 rss地图

Top