AIGC系列报告（五）：大模型多模态应用深化，AI Agent为应用普及提速.pdf

追踪当前AIGC行业发展，大模型多模态发展进一步深化，尤其文生视频能力快速提升，将大幅降低创作门槛，打开C端创作商业空间，及游戏、影视制作等B端视频应用空间。应用端，在大模型能力提升及大模型开发工具门槛降低共同作用下，AIAgent构建能力有望快速下沉，推动AI应用进一步爆发，也将推动大模型厂商需求提升。

□大模型文生视频能力快速发展，AIGC赋能智能创作。继文生图能力快速嵌入

各个大模型之后，文生视频为大模型多模态应用的下一重要方向。近期多家厂商发布相关产品或更新，大幅提升文生视频效果，实现更高清晰度、更高流畅度、视频任意修改等功能。海外厂商中，文生视频头部厂商Runway的发布Gen-2更新，支持4K高清视频，并新增“涂哪动哪”功能，实现由静态图到动态图的转变；此外Pika Labs发布Pika 1.0,实现高质量的Al视频生成与编辑。国内万兴科技天幕大模型也实现文生视频能力，万兴Filmora、万兴喵影、万兴播爆等工具实现大模型多模态应用商业化。文生视频能力升级将大幅降低创作门槛，打开C端创作商业空间，同时进一步打开游戏、影视制作等B端视频应用空间。

□更强的大模型基座能力+低门槛开发工具=Al Agent提升应用普及效率。大模型赋能让进一步智能化的Al Agent成为可能，未来或将使软件应用的范式从面向过程转为面向目标，提升AIGC应用的能力边界和使用效率。目前OpenAl的GPTs+Assistants API已为用户提供自定义Al Agent的初级形态，GPTBuilder自然语言开发大幅降低开发门槛，使人人都有可能拥有自己的人工智能助理，从供给端打开GPT相关Al应用空间。国内讯飞已构建星火助手生态，上架超5000个Al助手，昆仓万维发布天工SkyAgents,将Agent构建能力推向C端，国内应用爆发可期。大模型厂商纷纷跟进AlAgent浪潮，在大模型能力提升及大模型开发工具门槛降低共同作用下，Al Agent构建能力有望快速下沉，Al应用将迎来进一步爆发，也将推动大模型厂商需求提升。

□风险提示：Al应用研发进度不及预期；Al服务器供应链风险；Al芯片研发不及预期风险；技术创新不及预期。

1、大模型多模态能力升级，文生视频快速发展

大模型多模态能力升级，文生视频快速发展。继文生图能力快速嵌入各个大模型之后，文生视频为大模型多模态应用的下一重要方向。近期多家厂商发布相关产品或更新，大幅提升文生视频效果，实现更高清晰度、更高流畅度、视频任意修改等功能。如Runway的Gen-2发布更新，现可支持4K高清视频，并新增“涂哪动哪”功能，实现由静态图到动态图的转变；Meta发布Emu Video,既支持图像编辑，也支持根据文本图片生成高分辨率视频；字节跳动发布PixelDance,生成有高度一致性且有丰富动态性的视频，细节处理覆盖人物动作、脸部表情、相机视角控制、特效动作等；Pika Labs发布Pika 1.0,使用Al实现画布与视频长度拓展。文生视频能力升级将大幅降低创作门槛，打开C端创作商业空间，同时进一步打开游戏、影视制作等B端视频应用空间。

本文来自知之小站

PDF报告已分享至知识星球，微信扫码加入立享3万+精选资料，年更新1万+精选报告

（星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com）

相关文章

广东省私募基金涉诉纠纷大数据报告

罐头食品：小罐头大市场，让世界品尝“中国味道” 头豹词条报告系列

共赢行业数智化实践白皮书：拥抱数智化机遇，共赢数智化未来