METR研究显示在2个小时内的编程任务中,Claude 3.5 Sonnet和01-preview表现均优于人类专家。根据METR(Model Evaluation and Threat Research)研究结果,AI编程速度能以超越人类10倍速度生成并测试各种方案。给定2个小时,Claude 3.5Sonnet和ol-preview在7项具有挑战性研究工程中,击败了50多名人类专家。在一个需要编写自定义内核以优化前缀和运算的任务中,ol-preview不仅完成了任务,还创造了惊人的成绩:将运行时间压缩到0.64毫秒,甚至超越了最优秀的人类专家解
决方案(0.67毫秒)
Github调研显示AI在提高代码质量、使用新编程语言、生成测试案例等方面效果显著。根据Github2024年发布的一项针对全球软件开发者调查结果,目前已经有97%的受访开发者表示在工作内外中使用过AI编程类工具,他们认为AI在提高代码质量、使用新的编程语言并理解现有代码库以及生成测试用例方面效果显著。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)
