Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

行情 | 2024-04-12| 14
Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型

划重点:

🔍 LLMs在文本数据上展现出了令人印象深刻的能力,但在处理视频输入方面存在限制。

🧠 MA-LMM采用了记忆增强的方式,通过在线处理视频帧和存储特征来有效地解决了这些限制。

💡 MA-LMM在各种任务中表现出了优越性能,包括长期视频理解、视频问答、视频字幕生成和在线动作预测等。

站长之家(ChinaZ.com)4月12日 消息:Meta AI近日推出了一种名为MA-LMM的新型模型,旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力,但在处理视频输入方面存在一些限制,例如上下文长度限制和GPU内存限制。

为了克服这些限制,研究人员提出了MA-LMM,这是一种记忆增强的大型多模态模型,采用了在线处理视频帧和存储特征的方法。

MA-LMM模型的核心思想是通过顺序处理视频帧并将特征存储在长期记忆库中,以有效地保留长视频序列中的判别信息。该模型由三个主要组件组成:视觉特征提取器、可训练的查询变压器(Q-Former)以及大型语言模型。通过这种结构,MA-LMM能够在不增加GPU内存负担的情况下,显著提高处理长视频序列的效率,并有效地解决了LLMs中的上下文长度限制问题。

实验证明,MA-LMM在各种任务中表现出了优越性能。与现有模型相比,在长期视频理解、视频问答、视频字幕生成和在线动作预测等任务中,MA-LMM均取得了更好的效果。其创新性的设计以及利用长期记忆库和顺序处理的方法使得该模型能够在各种复杂场景下取得显著成果,证明了其在多模态视频理解应用中的有效性和多功能性。

项目入口:https://top.aibase.com/tool/ma-lmm

标签:, ,

相关推荐相关推荐

一季度收益34.86亿!零跑发布一季度财报:同比增加141.7%

一季度收益34.86亿!零跑发布一季度财报:同比增加141.7%

快科技5月17日消息,据媒体报道,零跑汽车公布了2024年第一季度的财务报告。财报显示,显示公司收益达到34.862亿元人民币,同比增长141.7%。尽管公司权益持有人应占亏损为10.129亿元,但相较于上年同期的11.33亿元有所减少。销量方面,零跑汽车总交付量达 ...

行情 3 2024-05-17
阿里云:微博已接入通义大模型 应用于AI评论、AI明星陪聊等

阿里云:微博已接入通义大模型 应用于AI评论、AI明星陪聊等

快科技5月17日消息,根据阿里云”官方消息,微博已成功将大模型技术融入其业务中,包括AI评论、AI明星陪聊、虚拟角色帐号、星座大模型以及信息流广告创意生成等多个方面,且已初显成效。据悉,微博是阿里云的长期合作伙伴,双方的合作历史已近十年。在面对 ...

行情 4 2024-05-17
三星Galaxy Z Fold6亮相GeekBench,性能飙升29%

三星Galaxy Z Fold6亮相GeekBench,性能飙升29%

【btna科技资讯】5月17日消息,近日,三星Galaxy Z Fold6手机在GeekBench跑分数据库中亮相,其6.3.0版本在单核测试中斩获1964分,多核测试得分高达6619分,展现了强劲的性能。为了让用户能够更清晰地感知到性能的提升,我们不妨将其与前代产品Galaxy Z F ...

行情 5 2024-05-17
苹果新举措:iPhone 16 Pro Max电池升级,续航能力大增

苹果新举措:iPhone 16 Pro Max电池升级,续航能力大增

【btna科技资讯】5月17日消息,据知名分析师郭明錤今日发布的投资简报透露,苹果公司计划在iPhone 16 Pro

行情 5 2024-05-17
安卓15 Beta 2存储设置大改:“系统”分类再细分

安卓15 Beta 2存储设置大改:“系统”分类再细分

【btna科技资讯】5月17日消息,近日,安卓工程师米沙尔・拉赫曼(Mishaal Rahman)在其博文中披露了一项关于安卓15 Beta

行情 5 2024-05-17
OPPO Reno12系列曝光:科技与潮流的完美结合

OPPO Reno12系列曝光:科技与潮流的完美结合

【btna科技资讯】5月17日消息,OPPO近日透露,他们将在5月23日正式推出新一代的OPPO Reno12系列手机,该系列被誉为“科技潮品”。今天,知名爆料者@Evleaks在推特上独家发布了OPPO Reno 12系列的高清渲染图,让我们得以一窥其设计风采。从渲染图中可以看 ...

行情 4 2024-05-17
OPPO朱海舟点赞苹果iPad Pro:想买、能用至少六年

OPPO朱海舟点赞苹果iPad Pro:想买、能用至少六年

快科技5月17日消息,前不久苹果更新了其iPad产品线,OPPO软件产品经理朱海舟在个人微博上表示:摸了新版 iPad Pro 13,确实好,想买”。他还提到自己家中的2018款iPad Pro 12.9至今仍然运行流畅,性能足够日常使用,因此也不一定要买最新款iPad Pro。最后 ...

行情 4 2024-05-17
摆拍“寒假作业丢巴黎”被全网封禁!网红猫一杯投资公司申请注销

摆拍“寒假作业丢巴黎”被全网封禁!网红猫一杯投资公司申请注销

据企查查最新信息显示,近日,广州凡几网络科技有限公司新增注销备案,注销原因为决议解散,公告期自5月9日至6月22日。企业信息显示,广州凡几网络成立于2022年10月,注册资本100万元,由网红Thurman猫一杯”(徐嘉艺)间接持股51%,担任实际控制人。今年2 ...

行情 5 2024-05-17
天涨粉314万,泼天流量砸中“草根网红”郭有才

天涨粉314万,泼天流量砸中“草根网红”郭有才

一首《诺言》全网刷屏,郭有才爆红出圈。郭有才-菏泽树哥,赞7621他梳着上世纪90年代流行的大背头,戴一副银丝框眼镜,身着复古风格的宽大西装,打着一条红白条纹领带,手上戴着副黑色皮手套,在直播间里声嘶力竭地唱着这首老歌:我不了解天长地久,要用这 ...

行情 5 2024-05-17
云开发工具初创公司Replit在推动生成式AI的同时裁员20%

云开发工具初创公司Replit在推动生成式AI的同时裁员20%

划重点:⭐ 云开发工具初创公司 Replit 裁员20%⭐️ CEO 表示公司将 AI 融入编码平台⭐️ 裁员原与公司未来发展战略有关站长之家(ChinaZ.com)5月17日 消息:云开发工具初创公司 Replit Inc.,作为推动生成式人工能编码的先锋,宣布裁减30名员工,约占其总员工 ...

行情 4 2024-05-17
Stability AI与Facebook前总裁等投资人进行筹款谈判

Stability AI与Facebook前总裁等投资人进行筹款谈判

重点:- 💰 投资人包括 Facebook 前总裁 Sean Parker 在内的一组投资者,正在与 Stability AI 进行筹款谈判。- 🔌 Stability AI 是一家开发基于开源图像生成器 Stable Diffusion 的产品的初创公司。- 🚀 这次投资将为 Stability AI 提供资金支持,并为其与媒 ...

行情 4 2024-05-17
OPPO Reno12搭载安卓版实况照片:媲美苹果iOS

OPPO Reno12搭载安卓版实况照片:媲美苹果iOS

快科技5月17日消息,博主数码闲聊站爆料,OPPO Reno12将搭载安卓版Live Photo实况照片,媲美苹果iOS,这项功能很快就会官宣。据悉,Live Photo已在iPhone上应用多年,用户启用Live Photo后,iPhone不仅仅会拍摄照片,它还会保存照片拍摄前后的画面,这样 ...

行情 6 2024-05-17
雷军登顶《歌手2024》摇人榜:投票是第二名17倍 马云也杀入前10

雷军登顶《歌手2024》摇人榜:投票是第二名17倍 马云也杀入前10

快科技5月17日,《歌手2024》摇人榜彻底被网友玩坏了。今天上午雷军登顶《歌手2024》摇人榜的消息传出后,网友纷纷围观榜单,并随手为雷军投上一票。截至下午16:35分,该榜单共有80万人参与投票,雷军得票高达60万票断崖式领先,是第二名韩红的17倍!雷军 ...

行情 6 2024-05-17
36个月流畅!Redmi Note 13R发布:第二代骁龙4领先版 1399元起

36个月流畅!Redmi Note 13R发布:第二代骁龙4领先版 1399元起

快科技5月17日消息,今日,Redmi Note 13R在小米商城上架,售价1399元起,发售时间待定。ID设计上,Redmi Note 13R采用双面玻璃机身设计,拥有浅海蓝、冰晶银、子夜黑三款配色,配有环形闪光灯。手机正面是一款6.79英寸LCD屏,支持120Hz高刷新率,240Hz触 ...

行情 7 2024-05-17
纽约诉讼案件称:AI 语音公司被控窃取配音演员声音

纽约诉讼案件称:AI 语音公司被控窃取配音演员声音

划重点:- 🚨 两名声优在纽约联邦法院对人工智能初创公司 Lovo 提起诉讼,指控该公司在其 AI 配音技术中非法复制和使用他们的声音。- 🎙️ 声优 Paul Skye Lehrman 和 Linnea Sage 声称 Lovo 在欺骗他们提供语音样本后,未经许可销售他们声音的 AI 版本。- ⚖️ ...

行情 4 2024-05-17