人工智能(AD研究人员一直在开发和完善大型语言模型(LLM),这些模型在各种领域和任务中表现出非凡的能力,挑战了我们对学习和认知的理解.OpenAI开发的最新模型GPT-4【Ope23】是使用前所未有的计算和数据规模进行训练的,在本文中,我们报告了我们对早期版本的GPT-4的调查,当时它还在OpenAt的积极开发中,我们认为(这个早期版本)GPT-4是新一批LLM的一部分(例如ChalGPT和谷歌的PaLM),它们比之前的Al 模型表现出更多的通用智能,我们讨论了这些模型不断提升的能力和影响,我们证明,除了对语言的掌握,GPT-4可以解决跨越数学、编码、视觉、医学、法律、心理学等新颖和困难的任务,而不需要任何特别的提示,此外,在所有这些任务中,GPT-4的表现惊人地接近人类的表现,而且大大超过之前的模型,如ChatGPT,鉴于GPT-4能力的广度和深度,我们相信它可以被合理地视为人工通用智能(AGD系统的早期版本(但仍不完整),在我们对GPT-4的探索中,我们特别强调发现其局限性,并讨论了向更深入、更全面的AGI版本推进所面临的挑战,包括可能需要追求超越下一个单词预测的新范式.最后,我们对最近技术飞跃的社会影响和未来研究方向进行了反思。
智能是一个多方面的、难以捉摸的概念,长期以来一直挑战着心理学家、哲学家和计算机科学家,1994年. 52名心理学家组成的小组签署了一个宽泛的定义,并发表在一篇关于智力科学的社论中,试图抓住它的本质【Gol97】.共识派将智力定义为一种非常普遍的心智能力,其中包括推理、计划、解决问题、抽象思考、理解复杂概念、快速学习和从经验中学习的能力,这一定义意味着智力并不同限于特定的领域或任务,而是包含了广泛的认知技能和能力.构建一个显示出1994共识定义所表述的那种通用智能的人工系统,是人工智能研究的一个长期而雄心勃勃的目标.在早期的著作中,人工智能(AD研究的现代学科的创始人为理解智能提出了一系列雄心勃勃的目标DMMRS06】.几十年来,人工智能研究人员一直在追求智能的原则,包括可泛化的推理机制(例如INSS59】,【LBFLS3】和构建包含大量常识语料库的知识库ILen95】.然而,AI研究中许多较近期的成功可以被摧述为狭隘地专注于明确定义的任务和挑战,例如下国际象棋或围棋,这些分别在1996 年和2016年被AI系统掌握。在20世纪90年代末和21世纪初,开发更通用的AI系统的呼声越来越高(例如(SBD’96】)。该领域的学术界试图确定可能作为更通用智能系统基础的原则(例如,【Lex08,GHT15)。“人工通用智能”(AGD一词在21世纪初得到普及(见IGoe14D。以强调从”狭义AI”(如正在开发的集中的、现实世界的应用程序所示)转向更广泛的智能概念的愿望,这又回到了早期AI研究的长期愿望和梦想,我们用AGI来指代上述1994年定义中所描述的展示广泛智能能力的系统,并有额外的要求,这些能力可能隐含在共识派的工作中,即达到或超过人类水平,然而,我们注意到,AGI并没有一个被广泛接受的单一定义,我们在结论部分讨论了其他定义.
过去几年,人工智能研究中最显著的突破是大型语言模型(Im)在自然语言处理方面取得的进展.这些神经网络模型基于Transformer架构VSP”17】,并在海量的web-text数据语料库上进行训练,其核心使用的是预测部分句子中的下一个单词的自监督目标,在本文中,我们报告了由OpenAI开发的一个新的LLM,它是GPT-4的早期和非多横态版本【Ope23】,根据1994年的定义,显示出许多智能的特征.尽管纯粹是一个语言模型,但这个早期版本的CPT-4在各种领域和任务上表现出了卓越的能力,包括抽象、理解、视觉、编码、数学、医学、法律、理解人类的动机和情感等等.在OpenAI早期开发GPT-4时,我们使用纯自然语言提问(提示)与GPT-4进行交互,在图1.1中,我们展示了GPT-4输出的一些初步示例,要求它以诗歌的形式写出质数无限的证明,用TiKZ(一种用LATEX创建图形的语言@画一只独角兽,用Pxthon创建一个复杂的动画,并解决一个高中水平的数学问题,它轻松地完成了所有这些任务,并且产生的输出基本上与人类能够产生的输出没有什么区别在至比人类能够产生的输出更好,我们还将GPT-4的性能与之前的LLM进行了比较,尤其是ChatGPT,它是GPT-3 【BMR’20】的微调(改进)版本,在图1.2中,我们展示了向ChatGPT询问质数无限性的证明诗歌和TikZ独角兽绘画的结果,虽然系统在这两项任务上的表现都不平凡,但与GPT-4的输出没有比较.这些初步的观察结果将在整个论文中重复出现,在各种各样的任务中。GPT-4能力的通用性,与跨越广泛领域的众多能力相结合,以及它在广泛的任务范围上达到或超越人类水平的表现,使我们可以轻松地说,GPT-4是迈向AGI的重要一步.
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)
