财中社 张海宁 2025-03-04 10:42 2.6w阅读
3月4日,中泰证券发布计算机行业报告。3月1日,DeepSeek在知乎上发...
3月4日,中泰证券发布计算机行业报告。3月1日,DeepSeek在知乎上发表《DeepSeek-V3 / R1推理系统概览》文章,表明其理论上一天的成本利润率可达545%。
最大程度优化推理系统,理论成本利润率高达545%。据该文章介绍,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现这两个目标,DeepSeek使用了大规模跨节点专家并行(ExpertParallelism/EP)的方法,并通过一系列技术策略如规模化跨节点专家并行、双批次重叠策略、最优负载均衡等方式,最大化资源利用率,最大程度地优化了大模型推理系统,实现了较高的性能和效率。通过时间上的成本控制,DeepSeek表示DeepSeekV3和R1推理服务占用节点上峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800GPU)。假定GPU租赁成本为2美元/小时,且所有tokens全部按照DeepSeekR1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。当然实际情况较理论计算盈利能力会有差距,因为V3定价更低,且收费服务目前仅占一部分,另外夜间也会有折扣。
对算力端影响:长期仍利好算力,头部云厂商持续受益。本次DeepSeek的系列发布活动,充分展示出DeepSeek在有限算力内最大程度利用了GPU的资源,实现了推理效率的大幅提升。通过模型和技术能力充分利用算力的资源,不代表所需算力的天花板降低,长期来看,模型能力仍走在“价格成本下降,能力提升”的发展趋势上,模型使用成本的下降、模型性能的提升,都将促使更多场景落地AI应用,这一过程反而将催生更多的算力需求。因此长期来看,算力端需求仍将持续高景气。具体而言:对于公有云:拥有较多云计算资源的头部厂商如互联网大厂,将具备更强的竞争优势,他们可通过错峰调配的方式提高算力资源的利用率,获取更多的收益;对于私有云:从数据与过程的安全性角度出发,AI模型的本地化部署需求仍为相当一部分用户的刚性需求,因此私有云产业同样具备一定的投资价值。
对应用端:有望进一步加速推动AI应用落地。DeepSeek模型及对应技术能力的开源,降低了AI模型能力的落地成本,从而有望真正推动更多的AI应用规模化落地场景,如企业管理端、政务处理端、工艺流管理等,都有望在未来一段时间内出现商业化较好的AI应用。