要点:
小红书搜索算法团队在AAAI2024上提出了一种创新框架,利用负样本知识来提升大语言模型(LLMs)的推理能力。
他们设计了一个模型专业化框架,包括负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,全面利用负样本在知识蒸馏中的关键作用。
该框架通过在训练和推理过程中充分利用负样本,使得小模型能够更好地处理复杂的数学推理问题,避免大模型的黑盒属性和庞大参数量的限制。
站长之家(ChinaZ.com)1月24日 消息:在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型(LLMs)在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本,而这项工作强调了负样本在知识蒸馏中的价值。通过负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,他们构建了一个全方位利用负样本的模型专业化框架。
论文地址:https://arxiv.org/pdf/2312.12832.pdf
首先,他们提出了负向协助训练(NAT)方法,通过设计dual-LoRA结构,从正向和负向两方面获取知识。这一步骤在训练中动态地集成正、负LoRA模块的知识,以构建更全面的推理能力。其次,他们设计了负向校准增强(NCE),利用负知识来帮助自我增强过程,通过KL散度来度量正、负推理链路之间的不一致性,以选择性地学习和增强嵌入的知识。
除了训练阶段,他们还在推理过程中利用负向信息,提出了动态自洽性(ASC)方法,通过排序模型在正、负样本上进行训练,为正确答案的推理链路分配更高的权重。整体来说,这一框架通过充分挖掘负样本的宝贵信息,使得小模型能够更有效地进行复杂的算术推理,从而在实际应用中更广泛地部署大语言模型的推理能力。
这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。
快科技5月7日消息,利民Thermalright最新推出的寒冰装甲Frozen Warframe PRO 360水冷散热器,以其独特的设计和强大的性能,为电脑散热领域带来了新的突破。这款水冷散热器的ARGB版到手价仅为539元。
快科技5月7日消息,据媒体报道,法拉第未来(Faraday Future)今日下午发布声明,明确表示目前没有计划任命贾跃亭为公司的联席CEO。
快科技5月7日消息,中国铁路官方消息,京广高铁武汉至广州段(以下简称武广高铁”)的安全标准示范线建设工程已成功完成拉通试验。
快科技5月7日消息,今天,moto X50 Ultra获得入网许可,该机的素颜照正式公布。 如图所示,moto X50 Ultra采用曲面屏方案,后置矩阵三摄,包含主摄、超广角和潜望长焦。 该机对应的国际版机型是moto Edge 50 Ultra,后者已在海外发布,两款机型的系统有区 ...
快科技5月7日消息,《英雄联盟》2024季中冠军赛(以下简称MSI”)胜败分组赛将今天17:00开打,首战由TES战队迎战TL战队。
快科技5月7日消息,RTX 50系列今年底发布基本没什么悬念,但具体什么时候、何种规格和性能都悬而未决,甚至发布顺序都可能不同以往,第一个登场的不一定就是RTX 5090。
快科技5月7日消息,今天,realme徐起为真我GT Neo6预热,该机支持120W闪充,配备5500mAh电池。
快科技5月7日消息,据媒体报道,在一次访谈中,SpaceX CEO埃隆马斯克被问及人工智能是否会加速他在太空探索方面的努力,他表示:还没看到它有什么用。”
快科技5月7日消息,今天,联发科天玑9300 平台正式亮相。 作为首批天玑9300 终端,iQOO Neo9S Pro现身天玑开发者大会,这是安卓阵营性能最强悍的双芯旗舰。 它不仅搭载了天玑9300 平台,同时配备iQOO自研电竞芯片Q1。 据悉,iQOO Q1芯片自研超分技术,采 ...
站长之家(ChinaZ.com)5月7日 消息:随着AI技术的不断进步,海外博主“Alasdair Mann”利用AI音乐工具Suno AI为路人即兴创作音乐,让更多人体验到了AI的乐趣。这一创新的尝试不仅在社交媒体上引起了广泛关注,还为AI音乐创作潮流增添了新的活力。
快科技5月7日消息,iQOO今日官宣Neo9S Pro将于本月正式亮相,首批搭载天玑9300 芯片。
快科技5月7日消息,近日,有媒体分享了特斯拉和SpaceX的CEO埃隆马斯克的日常。 报道称,马斯克在凌晨3点睡觉,第二天早上9点起床,每天大约6个小时的睡眠,但令人意想不到的是,这位亿万富翁总是以吃甜甜圈的方式开始新的一天。 马斯克曾在社交媒体表示, ...
“不好意思,刚刚和Kimi聊的人太多了。Kimi有点累了,可以晚点再问我一遍。”近期正在赶毕业论文的娄晓彤,时不时仍会收到AI助手Kimi无法使用的提示。
站长之家(ChinaZ.com)5月7日 消息:近日,B站官方发起了一项名为“AI故事创作大赛”的挑战赛,鼓励广大网友利用AI技术辅助生成具有大型纪录片风格的短视频。这一活动迅速吸引了大量网友的参与和关注。