10月20日消息,据媒体报道,NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer(nGPT)的新型神经网络架构。
这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达20倍,同时保持了模型的精度。
nGPT架构的核心在于将所有向量,包括嵌入、多层感知机(MLP)、注意力矩阵和隐藏状态,归一化为单位范数。
这种归一化处理使得输入的token在超球面表面上移动,每一层模型都通过位移来贡献最终的输出预测。
实验结果表明,nGPT在训练时所需的步骤比标准Transformer模型减少了4到20倍,具体加速效果取决于序列长度。
例如,在1k上下文中,训练速度提高了4倍;在4k上下文中,提高了10倍;而在8k上下文中,更是提高了20倍。
研究人员指出,nGPT的优化路径从超球面上的点开始,通过位移来贡献最终的输出预测,其中位移量由MLP和注意力模块定义。
这种方法不仅提高了训练速度,还增强了模型的稳定性。
以上就是关于【有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍】的相关消息了,希望对大家有所帮助!
12月8日消息,据国外媒体报道,英伟达CEO黄仁勋利用美国联邦遗产税和赠与税中的漏洞避税,金额或高达80亿美元。这可能将成为美国最大规模的避税操作之一。对此,英伟达方面不予置评。
12月8日消息,特斯拉中国官网最新上架了Model 3和Model Y的头枕和腰靠,头枕售价为219元,腰靠售价为269元,若组合购买则为459元一套。
12月8日消息,阿维塔E16,与阿维塔07同级的轿车,提供增程和纯电两种动力版本。 从预告图中可见,E16拥有流畅的侧面线条和溜背式设计,预示着优秀的风阻系数,尺寸可能略小于阿维塔12。 车身采用了黑色车顶与红色车身设计,造型非常运动。 搭配家族式 ...
据彭博社记者马克·古尔曼(Mark Gurman)的爆料报道称,苹果公司计划从2025年开始推出自研的5G调制解调器(基带芯片),以取代高通公司供应的5G基带芯片。但这种过渡不会突然完全替代,苹果计划至少需要三年时间才能完全转向自研5G基带芯片。
12月6日消息,近日英特尔宣布原CEO帕特·基辛格(Pat Gelsinger)正式退休,卸任董事会职务,同时任命David Zinsner和Michelle(MJ)Johnston Holthauus为公司临时联席CEO。
12月8日消息,德国总理奥拉夫·朔尔茨近日明确表示,大众汽车关闭工厂将是一个错误,强调作为欧洲最大的汽车制造商,大众对其员工负有责任。