摘要:大模型能力提升不断解锁新的应用场景
过去一年,大模型能力的发展建度超出我们预期。以衡量LLM的常用的多语言理解均值评
测标准(MMLU)为例,2021年底全球最先进大模型的MMLU 5-shot得分刚达到60%,2022年底超过70%,而2023年底已提升至超过85%。在语言能力之外,AI大模型的多模态能力也快速提升。2023年初,主流闭源大模型通常为纯文本的LLM。2023年至今,闭源模型的多模态能力具有大幅度提升,目前主流闭源大模型通常具备图像理解、图像生成能力。部分最前沿的闭源大模型,例如GPT-40、谷歌Gemini,支持的模态更加多元,能够理解文本、图像、普频、视频(愤),并生成文本、图像、普频。2022年9月,红彬资本预计还需要近十年的时间,大模型才能实现实习生级别的代码生成、好菜坞质量的视频和区别于机械声的人类质量语音,但是实际进展远超当时预期,Sora已经能够生成60s的高质量视频,GPT-40和谷歌Gemini都已经能够实现具备感情的实时人机语普交互。
我们看到,随着大模型能力的不断增强,AI的作用不晰浑化,生成式AI新的应用不晰放解
馈。通过对AI在搜素、电商零售、办公、金融法律、影视游戏,医药、教育、汽车等行业应用前景的分析,我们认为,AI应用的落地节奏或与行业数字化程度成正比,我们看到AI大模型在互联网(搜素+广告营销)、办公、金融等领域率先迎来“iPhone时刻”。其中最值得关注的应用包括:1)文本生成在电商、金融、医疗等行业替代传统客服:2)文本和图像生成在办公、广告营销、金融、影视游戏等领域成为下一代生产力工具:3)蛋白质生成能力拓宽人类探讨世界的范围,特别是在新药开发上的应用前景。硬件是大模型的重要载体,什么是AI大模型时代的最佳硬件形态是投资人最关心的话题之一。我们认为随着大模型能力的不断提升,新的硬件形态会被不断解锁。建议投资人沿着:
1)大模型加何贼能终端,2)终端如何解决大模型普及难点两条思路,寻找硬件的落地机会。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)