SuperCLUE中文大模型基准测评报告2023暨ChatGPT发布一周年特别报告.pdf

◆自2022年11月30日ChatGPT发布以来，Al大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。大致可以分为三个阶段，即准备期(ChatGPT发布后国内产学研迅速形成大模型共识)、成长期(国内大模型数量和质量开始逐渐增长)、煜发期(各行各业开源闭源大模型层出不穷，形成百模大战的竞争态势).

中文语言温解测评基准CLUE(The Chinese LanguageUnderstanding Evaluation)是政力于科学、客观、中立的语言模型评测基准，发起于2019年，陆续推出CLUE、FewCLUE、KgCLUE,DataCLUE等广为引用的测评基准。

SuperCLUE是大模型时代CLUE基准的发展和延续。聚焦于通用大模型的综合性测评，传统语言模型测评往往局限于学术范围的单轮选择题，SuperCLUE根据多年的测评经验，基于道用大模型在学术、产业与用户侧的广泛应用，构建了多层次、多维度的综合性测评基准。

本文来自知之小站

PDF报告已分享至知识星球，微信扫码加入立享3万+精选资料，年更新1万+精选报告

（星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com）

相关文章

2025中国金融大模型洞察企业竞争分析：金融大模型，铸就企业核心竞争力（阿里云·百度云·华为云·商汤科技）.pdf

艾瑞咨询：2025年中国农资电商研究报告.pdf

2025年中国养生水行业：养生饮品的崛起与创新之路.pdf