新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

编辑:英智 犀牛

【导读】AI编程智能体的能力正在飞速增长,最新研究揭示了这一「新摩尔定律」,如果AI智能体的任务时长继续以每4个月翻倍的速度增长,到2027年它们可能完成长达167小时的月级任务!

编程智能体能完成的任务量,正以爆炸式的速度增长!

而且,这一趋势还在加速。

2024到2025年,它们的任务处理能力每4个月翻一倍;而在2019到2025年,这个翻倍周期则是7个月。

22号,AI研究网站AI Digest发表了上述观点,揭示了一个AI智能体的新摩尔定律。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

博客地址:https://theaidigest.org/time-horizons

从图表中可以清晰地看到这一趋势,任务时长的增长轨迹几乎是一条陡峭的指数曲线。

2019年,GPT-2只能处理不到1秒的简单任务;2022年ChatGPT发布时,AI已经可以完成30秒的编程任务。

现在,智能体可以自主完成人类需要一小时才能完成的编程任务。

顶尖的AI系统可以完成的任务长度正在呈指数级增长——每7个月翻一番。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

这个趋势是METR的研究人员发现的。

他们选取了2019到2025年间最强的AI模型,测试了它们在大约200个任务上的表现。主要是编程任务,也有一些逻辑推理任务。

然后,他们把AI的成功率和每个任务的长度做了对比——任务长度指的是专业人士完成这些任务需要的时间,从不到30秒到超过8小时不等。

测试过所有模型后,出现了两个明显的规律:

  1. 任务长度和AI成功率高度相关(相关系数R²=0.83)。

  2. AI成功率达到50%的任务长度——即「时间跨度」——正在呈指数增长。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

接下来是什么?

这个指数增长的趋势看起来很稳健,没有停下来的意思。

如果按照这个趋势推算下去,AI智能体将能够完成:

  • 2026年:2小时的任务;

  • 2027年:1个工作日(8小时)的任务;

  • 2028年:1个工作周(40小时)的任务;

  • 2029年:1个工作月(167小时)的任务。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

最近,这一趋势还在加速。

2024-2025年间,时间跨度是每4个月任务长度翻一番,而2019-2025年间则是每7个月翻一番。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

如果按照2024-2025年加速的趋势(每4个月翻倍)推算,AI智能体可能在2027年就能完成月级任务(167小时)。

然而,仅观察一年的数据给出预测可能会不太稳定,实际的进步速度也可能会放缓。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

不过,考虑到这个趋势已经开始加速,它很可能处于一个比指数增长还要快的增长轨道上。

这也很符合直觉:随着增长轨道直线上升,1周和2周任务之间所需技能的差距,可能比1年和2年任务之间的差距更大。

此外,随着AI能力的提升,它们在开发更强大AI方面的作用会越来越大,可能导致超指数级增长。

智能爆炸

AI智能体的能力提升会反过来加速更强大AI的研发,形成飞轮效应:更强大的AI智能体能够更快地开发出更先进的AI系统,从而进一步提升能力。

这种正反馈循环可能导致超指数增长,甚至触发「软件智能爆炸」(software intelligence explosion),即AI能力在短时间内急剧提升,远远超过人类的水平。

此外,算法进步也在推动这一趋势。

METR的研究表明,近年来AI在算法效率上的提升,显着降低了计算资源需求。

通过更高效的预训练和后训练方法,即使硬件资源不增加,AI智能体的能力也能快速提升。

AI智能体任务时长的指数增长,可能成为人类历史上最具变革性的趋势之一。

它能在短时间内完成复杂任务,将彻底改变软件开发、科学研究、医疗诊断等多个领域。

例如,一个能够自主完成月级任务的AI智能体,可以完全自动化软件工程项目,甚至独立进行科学研究,从而大幅提高生产效率。

这一趋势也带来了潜在的社会挑战。随着AI智能体能力的快速提升,人类社会可能难以适应这种变化。

许多传统职业可能面临自动化,人类可能需要转向更具创造性和策略性的角色。

参考资料:

https://theaidigest.org/time-horizons

https://x.com/AiDigest_/status/1914710297157493173

内容来源于网络。发布者:科技网btna,转转请注明出处:https://www.btna.cn/6676.html

(0)
科技网btna的头像科技网btna
上一篇 2025年4月30日 下午3:54
下一篇 2025年4月30日 下午3:55

相关推荐

  • 异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底

    编辑:犀牛 英智 【导读】悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。 当谈到AI为何能从「预测下一个词」中诞生智慧时,Ilya Sutskever曾用一个生动的比喻来解释。 想象你在读一本悬疑小说,如果仅凭前…

    2025年4月18日
    7400
  • 多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

    编辑:Aeneas 犀牛 【导读】就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了! 检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量…

    2025年5月20日
    12400
  • 免费用!OpenAI发布「轻量版」Deep Research,o4-mini加持

    编辑:桃子 【导读】OpenAI正式向免费用户推出深入研究(Deep Research)了!这次是轻量版,由o4-mini加持,准确率高达45.6%。 OpenAI深度研究,免费用户也能用了。 一大早,OpenAI官宣了深度研究「轻量版」正式上线,不论是免费用户,还是Plus、Team、Pro用户,都能立即享用。 目前,这个版本是由o4-mini加持,继承了…

    2025年4月25日
    7500
  • 当一群技术博士决定搞点事情

    编辑:编辑部 【导读】在字节当技术人,是怎样一种体验?有探索时的迷茫、挣扎甚至是自我怀疑,也有收获成果后的兴奋与成就感。在这里,他们不断追求前沿,想为「世界折腾点东西出来」。 最近,字节跳动启动了新一年的筋斗云人才计划,共涵盖大模型应用、搜索/推荐/广告、计算机体系结构与系统优化、安全/AI Safety、硬件、AI Coding、视频架构、AIGC等八大领…

    2025年5月30日
    88300
  • 刚刚,物理学家实现了「点铅成金」!0.000001秒

    编辑:犀牛 好困 【导读】欧洲核子研究中心(CERN)的大型强子对撞机(LHC)刚刚实现了一项令人震惊的壮举:将铅转化为黄金!这一「点石成金」的过程虽然仅持续约一微秒,且成本高昂,却让17世纪炼金术士的梦想在现代物理学中成真。 就在刚刚,物理学家们将十七世纪炼金术士的梦想变成了现实! LHC实验不会产生大量的金块——但铅离子束中的某些粒子可以在大约一微秒内转…

    2025年5月12日
    9000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信