搜索历史清空

山西证券:OpenAI 新Sora上线提升视频生成能力

 财中社 冯静涵  2024-12-13 10:40  9935阅读

山西证券发布计算机行业点评称,相较于OpenAI 2月份发布的版本,此次上线的新Sora新增...

12月13日,山西证券发布计算机行业点评称,相较于OpenAI2月份发布的版本,此次上线的新Sora新增Storyboard、Remix、Re-cut等功能,视频再创作能力大幅提升,并且优化了视频生成速度及生成方式。

新Sora的新功能包括1)Storyboard:类似于电影里的分镜,即用户只需借助文字设计几段视频帧或直接上传图片作为静态视频帧,并在视频帧之间预留一些时间供Sora发挥,Sora便能自动把这些视频帧串联起来形成一段完整的视频;2)Remix:通过不同的文字描述对视频中的元素进行替换、删除或重构,比如可以把图书馆变成宇宙飞船;3)Re-cut:智能识别并剪切出视频中的最佳帧,并将其导入Storyboard中,拓展该视频帧;4)Loop:用于创建无限循环的视频;5)Blend:将两个视频无缝合并为一个视频;6)Stylepresets:为视频预设风格,比如黑白电影、纸片人等。此外,借助SoraTurbo,新Sora的视频生成速度显著提升,同时,新Sora将视频生成方式扩展为文/文+图/文+视频生成视频。

今年以来,国内企业开始加速研发并迭代AI视频生成产品,产品能力不断提升,应用场景持续拓宽。

1)今年6月,快手AI团队发布可灵AI视频生成大模型,可生成长达2分钟、分辨率达1080p的视频,可灵AI主要功能包括文生视频、图生视频、视频续写等;2)今年7月,智谱AI上线视频生成产品智谱清影,并在11月进行全新升级,支持生成时长为10秒的4K超高清视频,除常规的文生视频和图生视频功能外,智谱清影引入CogSound模型,可以对为生成的视频添加背景音乐;3)今年8月,字节推出即梦AI一站式创作平台,随后在11月宣布即梦AI两大视频模型S2.0Pro和P2.0Pro正式全量上线,其中,S2.0Pro在图生视频场景具有较高的首帧一致性,能够保持视频与用户输入图像的色彩、风格等保持一致,P2.0Pro具有极高提示词遵循能力,能够在一句提示词内实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性。

此外,Minimax、阿里云等初创企业及大模型厂商也在布局AI视频生成赛道,整体来看,视频生成工具的能力不断提升,未来有望渗透更多应用场景。

重要提示: 本文著作权归财中社所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至editor@caizhongshe.cn。

长按保存图片

相关文章

24小时热门文章

最新文章