搜索历史清空

广发证券:豆包实时语音大模型发布 提升字节AI产业链价值

 财中社 孙语彤  2025-01-21 10:55  2.1w阅读

1月21日,广发证券发布传媒行业报告。1月20日,豆包实时语音大模型正式推...

1月21日,广发证券发布传媒行业报告。1月20日,豆包实时语音大模型正式推出,并在豆包APP全量开放。模型实现了语音理解和生成一体化、端到端语音对话,主要面向中文语境和场景。依托于语音和语义联合建模。根据豆包大模型团队公众号,经外部众测,模型整体满意度较GPT-4o有明显优势,语音语气自然度和情绪饱满度高于GPT-4o。

预训练Scaling+后训练高质量数据和算法,带来语音模型拟人化、智商与表现力、低延迟方面的突破。传统语音对话任务系统具有对话自然度、有用性及安全性的局限。根据豆包大模型团队公众号,豆包团队在预训练阶段对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过Scaling,最大程度实现语音与文本能力深度融合和能力涌现,后训练阶段使用了高质量数据与RL算法,提供模型高情商对话能力与安全性。豆包实时语音大模型实现了拟人化的情感承接、强大的声音控制和丰富的情感演绎能力、智商与表现力的平衡以及丝滑的交互体验和超低延迟。

大模型和应用布局领先,关注字节AI产业链机会。目前字节旗下通用大模型及多模态能力在国内大厂中实现领先;根据AI产品榜,2024年12月,字节旗下App豆包、猫箱MAU分别达7116、688万人,成为国内AI对话、AI陪伴赛道月活Top1。字节正持续加大AI投入,未来预计将有更多技术及应用进展,字节AI产业链相关标的有望受益。

情感能力提升带动陪伴体验升级,关注音频类平台接入效果。我们预计情感陪伴类产品有望伴随模型能力的强化,在体验上有所提升,拥有具体应用场景的平台有望受益。其中,豆包自身的对话类陪伴产品猫箱具备体验升级的可能性;外部平台而言,以音频和对话为主的平台有望通过接入豆包情感模型提升平台服务能力;此外,AI玩具作为兼具教育与陪伴属性的AI硬件,有望显著受益于语音模型能力赋能。

投资建议。豆包实时语音大模型的发布,进一步丰富了字节AI生态,看好字节AI在国内的领先地位,未来发展潜力可期。同时,情感陪伴和AI玩具产品有望伴随语音类模型能力的强化,提升用户交互体验。建议关注:(1)与字节在AI领域具有合作基础的公司,如易点天下、蓝色光标等;(2)布局AI语音相关业务的公司,如盛天网络(音乐社交类平台“给麦”等)、昆仑万维(AI音乐产品Melodio和Mureka)等;布局AI玩具的公司,如上海电影、奥飞娱乐等;(3)行业层面来看,AI大模型能力提升、成本边际下降,持续完善的AI基础设施有望更好地赋能AI游戏、AI影视、AI营销、AI情感陪伴、AI教育、AIagent等场景。

重要提示: 本文著作权归财中社所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至editor@caizhongshe.cn。

长按保存图片

相关文章

24小时热门文章

最新文章