长江证券：DeepSeek R1模型性能显著提升国产大模型持续演进

财中社杨楚欣 2025-06-04 13:12 1.9w阅读

6月4日，长江证券发表研究报告称，5月28日，DeepSeek...

6月4日，长江证券发表研究报告称，5月28日，DeepSeekR1模型宣布完成小版本升级，当前版本为DeepSeek-R1-0528。用户通过官方网站、App或小程序进入对话界面后，开启“深度思考”功能即可体验最新版本。API也已同步更新，调用方式不变。

思维深度与推理能力显著提升，整体性能接近其他国际顶尖模型。DeepSeek-R1-0528使用DeepSeekV3Base模型作为基座，并在后训练过程中投入了更多算力，显著提升了模型的思维深度与推理能力。在AIME2025测试中，新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强：在AIME2025测试集上，旧版模型平均每题使用12Ktokens，而新版模型平均每题使用23Ktokens，表明其在解题过程中进行了更为详尽和深入的思考，整体表现上已接近o3与Gemini-2.5-Pro等其他国际顶尖模型水平。

其他能力同步更新，模型可用性持续提升。除深度思考能力强化外，此次DeepSeek-R1-0528在幻觉改善、创意写作、工具调用、前端代码生成、角色扮演等领域的能力均有更新和提升。其中DeepSeek-R1-0528针对“幻觉”问题进行了优化，使其在改写润色、总结摘要、阅读理解等场景中，幻觉率降低了45～50%左右，能够有效地提供更为准确、可靠的结果。认为这些更新大幅提升了DeepSeek-R1-0528的可用性，为DeepSeek的更广泛应用奠定了基础。

DeepSeek持续开源，推动我国大模型性能达领先水平。DeepSeek此次继续公布了DeepSeek-R1-0528的模型权重，其开源仓库（包括模型权重）仍然统一采用MITLicense，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型，与旧版本的DeepSeek-R1保持一致。在开源模式下，DeepSeek持续吸引开发者参与合作开发，推动我国大模型性能持续演进。此前，英伟达CEO黄仁勋表示DeepSeek和阿里巴巴的通义千问（Qwen）是“当前表现最优的开源AI模型之一”。我国开源大模型已经达到领先水平。

重要提示： 本文著作权归财中社所有。未经允许，任何单位或个人不得在任何公开传播平台上使用本文内容；经允许进行转载或引用时，请注明来源。联系请发邮件至editor@caizhongshe.cn。

长按保存图片

长江证券：数据要素释放乘数效应搭乘大赛开启投资新机遇

财中社 06-04

江海证券：箭元科技火箭成功回收助推卫星互联网发展

财中社 06-04

国泰海通：2025年天猫618抢先购榜单出炉中高端户外品牌表现强劲

财中社 06-04

名创优品单店日销118万，泡泡玛特海外赚50亿：出海潮玩盯上这3波人

财中社 06-04

华福证券：短期猪价承压下游消费回暖

财中社 06-03

24小时热门文章

碧桂园：延长早鸟重组支持协议及一般重组支持协议同意费用限期

财中社刚刚

中芯国际子公司拟向国科微出售中芯宁波14.832%股权

财中社刚刚

中国秦发出售全资附属公司金额3000万元

财中社刚刚

*ST花王股东花王集团3676万股拍卖成功成交价1.75亿元

财中社刚刚

丘钛科技完成对poLight私募配售成为最大单一股东

财中社刚刚

搜索历史清空