◆自2022年11月30日ChatGPT发布以来,Al大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破。大致可以分为三个阶段,即准备期(ChatGPT发布后国内产学研迅速形成大模型共识)、成长期(国内大模型数量和质量开始逐渐增长)、煜发期(各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势).
中文语言温解测评基准CLUE(The Chinese LanguageUnderstanding Evaluation)是政力于科学、客观、中立的语言模型评测基准,发起于2019年,陆续推出CLUE、FewCLUE、KgCLUE,DataCLUE等广为引用的测评基准。
SuperCLUE是大模型时代CLUE基准的发展和延续。聚焦于通用大模型的综合性测评,传统语言模型测评往往局限于学术范围的单轮选择题,SuperCLUE根据多年的测评经验,基于道用大模型在学术、产业与用户侧的广泛应用,构建了多层次、多维度的综合性测评基准。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)