设为首页 - 加入收藏
广告 1000x90
您的当前位置:主页 > 微商引流 > 微商资讯 > 正文

DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型

来源:网络分享 编辑:引流技巧 时间:2025-09-02

声明:本文来自于微信公众号 硅星人dmZTvGfMiPro,作者:summer。

在R2 和V4 到来之前,DeepSeekjavascript先让我们看到了“V3 Plus”。

3 月 24 日,DeepSeek一声不响的在Huggingface上发布了V3 的“小版本”迭代“DeepSeek-V3-0324”。开发者社区再次一片尝鲜与夸赞。

之后 3 月 25 日晚,官方发布了该版本的官方报告。在DeepSeek的报告里,给出了四个官方亮点指引,分别是推理能力、前端开发能力、中文写作能力、中文搜索能力的强化。

乍看起来,这些能力提升都聚焦在用户常见任务场景之上。这也的确是一次非常注重实用性的升级,虽名为“小版本”,V3- 0324 却在多个关键能力上实现了显著突破,javascript尤其是代码生成能力的提升令人印象深刻。用户只需关闭深度思考模式,就能体验这一新版本,而API接口和使用方式保持不变。

而仔细观察这几个提升的领域,会发现一个有意思的点:DeepSeek给V3 做的提升,全都落在R1 的优势能力范围内了啊。

据报告显示,推理能力的提升主要体现在新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提高,特别是在数学、代码类相关评测集上取得了超过 GPT-4.5、Claude-Sonnet-3. 7 的得分成绩。

与社区测试相呼应,DeepSeek官方在技术报告中也展示了模型的前端代码能力。报告中展示了一个p5.js小球物理运动程序,包含可调整的物理参数和赛编程博朋克风格界面,不仅功能完整,还具有高度的美观性和交互性。

更重要的是,这个不比Claude差的新版本编程客栈,可以免费使用,据网友测算,付费API的价格更是便宜了 15 倍。

这种对技术命名的诚实态度,也是外界格外期待R2 的重要理由。

而这次更新最重要的地方还在于,DeepSeek的V3 和R1 出现后,如Anthropic等对手在尝试用新方法超车,核心在于把推理模型和大语言模型融合,无论是产品上通过AI的自动调配来融合到一起,还是从模型层面就“合二为一”。

现在看来,DeepSeek此次更新也很直白的展示了自己接下来的路线,也是把V系列和R系列融合成一个新模型。

官方报告中明确指出,此次更新与之前的DeepSeek-V3 使用同样的base模型,仅改进了后训练方法,并借鉴了DeepSeek-R1 模型训练过程中的强化学习技术。

这是纯RL路线的再一次的验证和公示,在对手们继续闭源并使用“唯一混合模型”这样的概念来吸引人的时候,它继续通过开源为行业提供公开的高效迭代思路。DeepSeek这开源的仗还会继续打下去,好戏还在后面。

相关推荐:

栏目分类

微商引流技巧网 www.yinliujiqiao.com 联系QQ:1716014443 邮箱:1716014443@qq.com

Copyright © 2019-2024 强大传媒 吉ICP备19000289号-9 网站地图 rss地图

Top