计算机行业行业深度报告:Deepseek冲击波:AI狂潮下计算机行业的颠覆与重生.pdf

(一)DeepSeek冲击波引发全球科技市场的连锁反应
DeepSeek作为中国AI领域的突破性成果,凭借其低成本、高性能的技术路线和开源策略,引发了全球科技市场的深刻变革。其技术普惠化和开源模式不仅推动了AI技术的广泛应用,还对全球科技产业链、资本市场和国际竞争格局产生了深远影响。
根据数据分析平台QuestMobile最新数据显示,从上线以来至2月9日,DeepSeekAPP的累计下载量已超1.1亿次,周活跃用户规模最高近9700万。其中,1月20日至1月26日,DeepSeekAPP周下载量达到226万次。次周,下载量则直接飙升至6300万次,环比增长超2700%。
在用户体验方面,DeepSeek表现不俗。用户普遍认为DeepSeekR1的性能出色,特别是在数学推理、编程能力和自然语言理解等领域。其推理速度和准确度在多个测试场景中达到业界领先水平。此外,DeepSeekR1的“聪明”特性使得用户无需复杂的提示词技巧,即可获得高质量的回答。在实际使用场景中,无论是游戏、视频播放还是日常工作的辅助,其流畅的操作体验都得到了用户的高度评价。用户反馈显示,DeepSeek界面简洁直观、操作简单,在实时数据推送和内容推荐上十分出色,能够有效提升工作效率,减少用户在信息检索上的时间投入。
DeepSeekR1的发布引起了硅谷科技领袖、国际媒体及学术界的广泛关注。其性能和开源策略获得了高度评价,被认为是“非美国公司践行OpenAI初心”的典范。DeepSeekR1的发布引发了全球科技市场的连锁反应。其开源策略、低成本、高性能的特性,对科技巨头形成了压力。其训练成本仅为600万美元,远低于OpenAI和谷歌等公司的同类模型,《MIT Technology Review》提到,DeepSeek开发了一种名为“Group Relative Policy Optimization(GRPO)”的新算法,通过创新的训练方法大幅降低了模型的训练成本,还指出,DeepSeek在硬件优化方面也取得了突破,并强调了DeepSeek通过免费开放模型的方式,推动了AI技术的普及和应用。
DeepSeek的崛起促使全球投资重心从硬件密集型企业转向算法优化和应用开发领域。尽管DeepSeek降低了单个模型的算力需求,但其技术普惠化反而刺激了应用场景的扩展,导致算力总需求暴增(“杰文斯悖论”再次生效),而其技术路径的转变降低了对高端GPU的依赖,为国产芯片提供了新的发展机遇,其软硬件协同优化(如尽可能绕过英伟达提供的CUDA软件,直接使用汇编语言PTX与硬件对话),为国产芯片和系统闭环提供了技术验证,推动国内从“模型-芯片-系统”全链条自主化。
(二)DeepSeek公司成立背景与发展历程
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由幻方量化的联合创始人梁文峰创立。公司自2023年7月年成立以来,始终专注于大语言模型(LLM)及其相关技术的深度研发。公司坚持技术创新路线,开创性地提出多头潜在注意力机制(MLA)和DeepSeekMoE等创新架构。凭借这些创新成果,DeepSeek的大模型在多项权威测评中展现出顶尖的性能表现。DeepSeek的成立标志着幻方量化从量化投资领域向通用人工智能(AGI)领域的拓展。幻方量化为DeepSeek提供了强大的硬件支持,使得DeepSeek在技术研发上具备了坚实的基础。
DeepSeek自成立以来,迅速在大语言模型(LLM)及相关技术研发方面取得了显著进展。以下是其主要发展历程:
2023年11月2日:发布首个开源代码大模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)