2022年11月30日,OpenAl推出对话式通用人工智能工具——ChatGPT,凭借其出色的语言理解、生成和知识推理能力在上线5天后活跃用户数就达到了100万,在2个月内活跃用户数达1个亿,成为历史上用户数量增长最快的消费者应用程序,受到各国政府、企业界、学术界的广泛关注,推动AIGC行业迈出了开拓性的一步。
AIGC(Al-Generated
Content),生成式人工智能,指利用人工智能技术生成的数字内容,包括文本、图像、音视频、代码等形式,属于人工智能技术催生的新兴行业。AIGC是基于自然语言处理、生成任务算法、预训练大模型、多模态技术融合的前沿人工智能技术,通过数据训练寻找规律,利用泛化能力输出使用者需要的内容。
在AlGC行业的算力层,有14家北京市专精特新企业深耕领域,具有较强竞争实力,他们平均每家拥有发明专利16个,平均深耕行业8年以上,平均营
业收入超1.8亿元。
斯坦福大学吴恩达教授提出二八定律:80%的数据
+20%的模型=更好的Al
当前,主流数据集多以英文为主,中文数据集紧缺。根据360分析,中文语料数据集占比低于5%。此外,中文预料数据集质量差,数据集种类和内容缺乏多元化,专用领域数据集基本空白,在政府、医学、金融等公共领域的开源数据稀缺。对比之下,美国拥有大量的文本、目标检测数据集。因此,中国AlGC产业链的数据集环节存在“堵点”。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)