人工智能行业深度报告:从Sora看多模态大模型发展.pdf

1、OpenAl发布视频生成模型Sora,视频生成能力实现大幅提升:
·2024年2月16日,OpenAl发布视频生成模型Sora,能生成各种持续时间(甚至长达1分钟)、宽高比和分辨率的视频和图片。Sora模型基于Diffusion Transformer技术,采用视频压缩网络(Video compression network)、潜空间patch(Spacetime latent patches)、直接在原始大小训练(Training on data at its native size)以及重新标注技术(Re-captioning technique)技术,可以图像和视频作为输入,实现制作无缝循环视频、给静态图片添加动画、扩展视频时间线、视频到视频编辑、视频拼接等功能;
2、国内外厂商相继发力布局多模态大模型领域,2024年文生视频有望进入商业化探索阶段:
· 目前除OpenAl之外,谷歌、字节跳动等厂商均已推出具备文生视频能力的多模态模型。基于对Stable Video Diffusion、谷歌W.A.L.T以及其它文生视频模型的分析,我们认为高质量数据以及底层通用大模型是文生视频能力的重要决定因素,随着Transformer架构的引入,以及3D建模领域模型的迭代,2024年文生视频有望在时间长度、画面清晰度、内容逼真程度等方面实现显著迭代,打开商业化应用空间。
3、海外已有部分文生视频商业化案例,未来有望覆盖全球干亿级视频内容生成市场:
· Prescient &Strategic Intelligence数据显示,2025年全球数字视频内容市场规模有望达到3271.9亿美元,2021~2025年CAGR约为13.7%。目前海外已有Synthesia、Runway等厂商在文生视频领域形成成熟商业方案,应用于企业产品介绍、操作指南、客户服务等场景。我们认为以Sora为代表的多模态模型有望显著降低视频等数字内容的创作成本,市场空间广阔。
4、建议关注标的:
· (1)大模型厂商:科大讯飞、云从科技、微软、谷歌;(2)多模态应用厂商:万兴科技、虹软科技、焦点科技、Adobe ;
风险提示
· 1、AI技术迭代不及预期的风险;2、Al商业化产品发布不及预期;3、政策不确定性带来的风险;4、下游市场不确定性带来的风险;预计2028年全球大模型市场规模将超过1000亿美元。根据大模型之家、钛媒体数据,预计2023年全球大模型市场规模达到210亿美元,同比
增长94.4%。预计到2028年全球大模型市场规模将达到1095亿美元,2022~2028年复合增长率约为47.12%,根据IDC预测,全球生成式Al计算市场规模将从2022年的8.2亿美元增长至2026年的109.9亿美元,CAGR约为91.34%。
预计至2028年我国大模型市场规模接近1200亿人民币。根据大模型之家、钛媒体数据,预计2023年中国大模型市场规模达到147亿人民币,
同比增长110.0%。预计到2028年中国大模型市场规模将达到1179亿人民币,2022~2028年复合增长率约为60.11%,市场规模快速成长。多模态大模型带来AI全新应用场景,多模态内容市场规模有望快速成长。第一财经数据显示,预计至2025年,中国多模态内容市场规模将达
到832.7亿美元,2018-2025年复合增长率达65.02%。多模态大模型内容将主要应用于商业定制、医疗、游戏、教育和影视领域。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)