搜索历史清空

长江证券:DeepSeek R1模型性能显著提升 国产大模型持续演进

 财中社 杨楚欣  2025-06-04 13:12  1.9w阅读

6月4日,长江证券发表研究报告称,5月28日,DeepSeek...

6月4日,长江证券发表研究报告称,5月28日,DeepSeekR1模型宣布完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、App或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

思维深度与推理能力显著提升,整体性能接近其他国际顶尖模型。DeepSeek-R1-0528使用DeepSeekV3Base模型作为基座,并在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12Ktokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考,整体表现上已接近o3与Gemini-2.5-Pro等其他国际顶尖模型水平。

其他能力同步更新,模型可用性持续提升。除深度思考能力强化外,此次DeepSeek-R1-0528在幻觉改善、创意写作、工具调用、前端代码生成、角色扮演等领域的能力均有更新和提升。其中DeepSeek-R1-0528针对“幻觉”问题进行了优化,使其在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更为准确、可靠的结果。认为这些更新大幅提升了DeepSeek-R1-0528的可用性,为DeepSeek的更广泛应用奠定了基础。

DeepSeek持续开源,推动我国大模型性能达领先水平。DeepSeek此次继续公布了DeepSeek-R1-0528的模型权重,其开源仓库(包括模型权重)仍然统一采用MITLicense,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型,与旧版本的DeepSeek-R1保持一致。在开源模式下,DeepSeek持续吸引开发者参与合作开发,推动我国大模型性能持续演进。此前,英伟达CEO黄仁勋表示DeepSeek和阿里巴巴的通义千问(Qwen)是“当前表现最优的开源AI模型之一”。我国开源大模型已经达到领先水平。

重要提示: 本文著作权归财中社所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至editor@caizhongshe.cn。

长按保存图片

相关文章

24小时热门文章

最新文章