新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

编辑:英智 犀牛

【导读】AI编程智能体的能力正在飞速增长,最新研究揭示了这一「新摩尔定律」,如果AI智能体的任务时长继续以每4个月翻倍的速度增长,到2027年它们可能完成长达167小时的月级任务!

编程智能体能完成的任务量,正以爆炸式的速度增长!

而且,这一趋势还在加速。

2024到2025年,它们的任务处理能力每4个月翻一倍;而在2019到2025年,这个翻倍周期则是7个月。

22号,AI研究网站AI Digest发表了上述观点,揭示了一个AI智能体的新摩尔定律。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

博客地址:https://theaidigest.org/time-horizons

从图表中可以清晰地看到这一趋势,任务时长的增长轨迹几乎是一条陡峭的指数曲线。

2019年,GPT-2只能处理不到1秒的简单任务;2022年ChatGPT发布时,AI已经可以完成30秒的编程任务。

现在,智能体可以自主完成人类需要一小时才能完成的编程任务。

顶尖的AI系统可以完成的任务长度正在呈指数级增长——每7个月翻一番。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

这个趋势是METR的研究人员发现的。

他们选取了2019到2025年间最强的AI模型,测试了它们在大约200个任务上的表现。主要是编程任务,也有一些逻辑推理任务。

然后,他们把AI的成功率和每个任务的长度做了对比——任务长度指的是专业人士完成这些任务需要的时间,从不到30秒到超过8小时不等。

测试过所有模型后,出现了两个明显的规律:

  1. 任务长度和AI成功率高度相关(相关系数R²=0.83)。

  2. AI成功率达到50%的任务长度——即「时间跨度」——正在呈指数增长。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

接下来是什么?

这个指数增长的趋势看起来很稳健,没有停下来的意思。

如果按照这个趋势推算下去,AI智能体将能够完成:

  • 2026年:2小时的任务;

  • 2027年:1个工作日(8小时)的任务;

  • 2028年:1个工作周(40小时)的任务;

  • 2029年:1个工作月(167小时)的任务。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

最近,这一趋势还在加速。

2024-2025年间,时间跨度是每4个月任务长度翻一番,而2019-2025年间则是每7个月翻一番。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

如果按照2024-2025年加速的趋势(每4个月翻倍)推算,AI智能体可能在2027年就能完成月级任务(167小时)。

然而,仅观察一年的数据给出预测可能会不太稳定,实际的进步速度也可能会放缓。

新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

不过,考虑到这个趋势已经开始加速,它很可能处于一个比指数增长还要快的增长轨道上。

这也很符合直觉:随着增长轨道直线上升,1周和2周任务之间所需技能的差距,可能比1年和2年任务之间的差距更大。

此外,随着AI能力的提升,它们在开发更强大AI方面的作用会越来越大,可能导致超指数级增长。

智能爆炸

AI智能体的能力提升会反过来加速更强大AI的研发,形成飞轮效应:更强大的AI智能体能够更快地开发出更先进的AI系统,从而进一步提升能力。

这种正反馈循环可能导致超指数增长,甚至触发「软件智能爆炸」(software intelligence explosion),即AI能力在短时间内急剧提升,远远超过人类的水平。

此外,算法进步也在推动这一趋势。

METR的研究表明,近年来AI在算法效率上的提升,显着降低了计算资源需求。

通过更高效的预训练和后训练方法,即使硬件资源不增加,AI智能体的能力也能快速提升。

AI智能体任务时长的指数增长,可能成为人类历史上最具变革性的趋势之一。

它能在短时间内完成复杂任务,将彻底改变软件开发、科学研究、医疗诊断等多个领域。

例如,一个能够自主完成月级任务的AI智能体,可以完全自动化软件工程项目,甚至独立进行科学研究,从而大幅提高生产效率。

这一趋势也带来了潜在的社会挑战。随着AI智能体能力的快速提升,人类社会可能难以适应这种变化。

许多传统职业可能面临自动化,人类可能需要转向更具创造性和策略性的角色。

参考资料:

https://theaidigest.org/time-horizons

https://x.com/AiDigest_/status/1914710297157493173

内容来源于网络。发布者:科技网btna,转转请注明出处:https://www.btna.cn/6676.html

(0)
科技网btna的头像科技网btna
上一篇 2025年4月30日 下午3:54
下一篇 2025年4月30日 下午3:55

相关推荐

  • 深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星

    编辑:编辑部 YZH 【导读】阿里Qwen3凌晨开源,正式登顶全球开源大模型王座!它的性能全面超越DeepSeek-R1和OpenAI o1,采用MoE架构,总参数235B,横扫各大基准。这次开源的Qwen3家族,8款混合推理模型全部开源,免费商用。 就在今天凌晨,备受全球期待的阿里新一代通义千问模型Qwen3开源! 一经问世,它立刻登顶全球最强开源模型王座…

    智能 2025年4月29日
    10500
  • DeepMind果蝇登Nature,强化学习再立功!AI模拟飞行,逼真到腿毛颤抖

    编辑:英智 KingHZ 【导读】谷歌DeepMind与HHMI Janelia研究所的科学家们,用AI打造了一个栩栩如生的虚拟果蝇模型。这个模型不仅能精准模拟果蝇的飞行与行走,还通过深度强化学习模仿真实果蝇的行为。 一只小小的果蝇是如何在空中优雅地飞舞,或者在地面上灵活地爬行的? 这些看似简单的动作背后,隐藏着复杂的生物机制和神经控制。 为了揭开这些秘密,…

    2025年4月25日
    8300
  • 几行代码,一窥上帝造物!帝国理工开源CAX,引爆人工生命新纪元

    编辑:KingHZ 【导读】人工生命的革命来临!帝国理工的研究人员,开源了名为CAX的硬件加速工具。只需几行代码,就能复刻人工生命实验,模拟速度可提升2000倍,部分表现甚至超过了GPT-4! 人工生命研究的新纪元! 「人工生命」(artificial life,或简写为ALife),旨在模拟生命的行为、特性和演化过程,理解生命的本质,涉及涌现现象、自组织系…

    2025年4月24日
    5200
  • AI引爆全球失业潮,美国大学生毕业即失业!全球大厂联手裁员上万

    编辑:Aeneas 定慧 【导读】现在,AI已经彻底引爆了全球失业潮,多邻国裁员只是多米诺骨牌的第一张而已。外媒统计发现,全球五家大企业已经因为AI裁员了上万人。更有统计数据显示,最近美国大学毕业生的失业率异常之高,已经达到了5.8%! 不开玩笑,AI带来的全球失业潮,是真的来了! 从前,这种呼声只是零星从某些人嘴里被预言,但现在,主流的媒体已经全面认识到了…

    2025年5月5日
    6900
  • 曝小米Civi 5 Pro二季度末发布 厚度7开头 内置6K电池

    现阶段,小米品牌(不含REDMI)旗下手机产品线主要有数字系列、MIX系列以及Civi系列。其中,数字系列销量最佳,而Civi系列相较于另外两个系列,市场热度一直不算高。因此,小米接下来可能会在该系列加大投入。近日,就有博主爆料了小米Civi 5 Pro的配置信息,相比上一代,亮点颇多。 据博主透露,小米Civi 5 Pro的厚度最终定档7.xmm,内置60…

    2025年3月20日
    29900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信