AIGC系列报告(五):大模型多模态应用深化,AI Agent为应用普及提速.pdf

追踪当前AIGC行业发展,大模型多模态发展进一步深化,尤其文生视频能力快速提升,将大幅降低创作门槛,打开C端创作商业空间,及游戏、影视制作等B端视频应用空间。应用端,在大模型能力提升及大模型开发工具门槛降低共同作用下,AIAgent构建能力有望快速下沉,推动AI应用进一步爆发,也将推动大模型厂商需求提升。

□大模型文生视频能力快速发展,AIGC赋能智能创作。继文生图能力快速嵌入

各个大模型之后,文生视频为大模型多模态应用的下一重要方向。近期多家厂商发布相关产品或更新,大幅提升文生视频效果,实现更高清晰度、更高流畅度、视频任意修改等功能。海外厂商中,文生视频头部厂商Runway的发布Gen-2更新,支持4K高清视频,并新增“涂哪动哪”功能,实现由静态图到动态图的转变;此外Pika Labs发布Pika 1.0,实现高质量的Al视频生成与编辑。国内万兴科技天幕大模型也实现文生视频能力,万兴Filmora、万兴喵影、万兴播爆等工具实现大模型多模态应用商业化。文生视频能力升级将大幅降低创作门槛,打开C端创作商业空间,同时进一步打开游戏、影视制作等B端视频应用空间。

□更强的大模型基座能力+低门槛开发工具=Al Agent提升应用普及效率。大模型赋能让进一步智能化的Al Agent成为可能,未来或将使软件应用的范式从面向过程转为面向目标,提升AIGC应用的能力边界和使用效率。目前OpenAl的GPTs+Assistants API已为用户提供自定义Al Agent的初级形态,GPTBuilder自然语言开发大幅降低开发门槛,使人人都有可能拥有自己的人工智能助理,从供给端打开GPT相关Al应用空间。国内讯飞已构建星火助手生态,上架超5000个Al助手,昆仓万维发布天工SkyAgents,将Agent构建能力推向C端,国内应用爆发可期。大模型厂商纷纷跟进AlAgent浪潮,在大模型能力提升及大模型开发工具门槛降低共同作用下,Al Agent构建能力有望快速下沉,Al应用将迎来进一步爆发,也将推动大模型厂商需求提升。

□风险提示:Al应用研发进度不及预期;Al服务器供应链风险;Al芯片研发不及预期风险;技术创新不及预期。

1、大模型多模态能力升级,文生视频快速发展

大模型多模态能力升级,文生视频快速发展。继文生图能力快速嵌入各个大模型之后,文生视频为大模型多模态应用的下一重要方向。近期多家厂商发布相关产品或更新,大幅提升文生视频效果,实现更高清晰度、更高流畅度、视频任意修改等功能。如Runway的Gen-2发布更新,现可支持4K高清视频,并新增“涂哪动哪”功能,实现由静态图到动态图的转变;Meta发布Emu Video,既支持图像编辑,也支持根据文本图片生成高分辨率视频;字节跳动发布PixelDance,生成有高度一致性且有丰富动态性的视频,细节处理覆盖人物动作、脸部表情、相机视角控制、特效动作等;Pika Labs发布Pika 1.0,使用Al实现画布与视频长度拓展。文生视频能力升级将大幅降低创作门槛,打开C端创作商业空间,同时进一步打开游戏、影视制作等B端视频应用空间。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)