当前动态:o1推理将用于图像理解,现场演示2分钟开发应用,OpenAI在伦敦捅了开发者窝

智趣 | 2024-10-31| 15

大家好,今天小编来为大家解答【o1推理将用于图像理解,现场演示2分钟开发应用,OpenAI在伦敦捅了开发者窝】这个问题,很多人还不知道,现在让我们一起来看看吧!

西风 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI在Cursor里用o1-mini现场捏应用,两分钟,直接控制无人机飞行

引得台下观众传来阵阵惊呼:

如此操作,刚刚发生在OpenAI伦敦开发者日活动上。作为OpenAI的“科技春晚”,真是好不热闹,现场挤满了人从众。

OpenAI产品部负责人Olivier Godement还剧透了一波o1新功能——

包含功能调用开发者消息流媒体结构化输出图像理解5个方面。

奥特曼在之后的问答环节表示不想剧透,但透露“图像模型将很快迎来显著提升”。他提到,复制现有模型并不难,而让他为OpenAI感到自豪的是,他们始终在创造新的突破。

网友们听到这里更兴奋了:

不确定他指的是图像生成还是图像分析,还是两者都有。但想象一下用图像token进行推理。如果你面临一个视觉问题,或许可以逐步地把问题可视化。我目前还没有在其它模型中真正看到过类似的功能。

OpenAI要在图像方面发力其实也早有迹可循。

不久前,两位清华校友路橙、宋飏就在OpenAI发布最新图像生成研究。

他们简化了一致性模型,仅用两步采样,就能使生成质量与扩散模型相媲美,速度是扩散模型的50倍。

此外,对于OpenAI所说的图像模型,还有人猜测不会是前几天登顶文生图竞技场的爆火神秘小熊猫(red_panda)吧?

但这种说法很快就被否定了。

小熊猫背后团队Recraft AI已发推文认领,这是他们的新模型recraft-v3。

总之,o1这次算是吊足了大伙儿的胃口,网友喊话赶紧发4.5o和5-preview:

虽然很棒,但现在仍没有一款编码能打Sonnet的模型。

奥特曼还说了啥

在现场,奥特曼还被问到OpenAI的发展方向是更像o1这样的模型,还是会有更大规模的模型?

他表示想在各方面都变得更好,但推理模型的发展对OpenAI尤其重要。

我认为推理能力将解锁我们多年来期望实现的许多事情,比如在新科学领域做出贡献,或帮助编写非常复杂的代码,这些都会带来显著的推动。所以,大家应该期待o系列模型会快速改进,这对我们来说具有重要的战略意义。

在谈论到“什么是Agent”、“它们可以做什么”,奥特曼表示Agent是一个可以接受长期执行任务,并在执行过程中只需很少监督的东西。

奥特曼认为大家最常举的一个例子是可以让Agent帮忙预订餐厅,它可以用在线餐厅预订平台OpenTable或者是直接打电话到餐厅。

这确实能为人们减少一些工作,但更有趣的事是能创造一个世界,在那里可以做一些人类无法或不愿做的事。

比如与其让Agent打电话给餐厅预订座位,不如让Agent打给300家,找到最好吃或是最有特色的那一家,它可以并行处理大量任务。

Agent成为一个非常聪明的高级同事,你可以和它在项目上协作,也可以让它独立去做两天甚至两周的任务,做好后带着成果回来与你交流。

自动播放

接下来,奥特曼还被问到最敬重的竞争对手是哪个,他提到的第一个就是Cursor AI,但随后又补充道:

我的意思是,我现在有点尊敬这个领域里的每个人。我认为整个领域正在涌现出非常了不起的工作,而且有许多才华横溢、非常努力的人。我不是想回避问题,而是想说我可以指出很多非常厉害的人在做非常出色的工作。

要知道,昨天微软刚刚宣布了GitHub Copilot接入Claude和Gemini。

奥特曼转头给了微软竞争对手Cursor AI一个点赞……

此外,奥特曼还被问到最令人兴奋的AI应用场景是什么,他再次Q到Agent:

大家关注的点各不相同,有很多不同的方式可以解决这个问题,但我希望能有一种AI能够理解你整个人生。它不一定需要拥有无限的上下文,但能够有一个AI Agent,某种程度上知道关于你的一切,能够访问你所有的数据之类的东西。

奥特曼还认为大模型的大多数缺点将在未来几代中逐步消失。

不要构建一个填补漏洞或绕过模型缺陷的工具,而是构建一个能利用未来优势的模型。

One More Thing

除了预告,OpenAI还有最新动作——

开源了一个评估语言模型回答简短、事实性问题能力的新基准,名为SimpleQA

论文共同一作是去年在X上约战提示词决斗引得大伙儿纷纷围观的Jason Wei(思维链开山论文一作)和Karina Nguyen(提示词决斗那会儿还在Anthropic,现已是OpenAI工程师)。

有意思的是,o1-mini和o1-preview在此基准上都不及格,而且两者相差还很大:

以上就是【o1推理将用于图像理解,现场演示2分钟开发应用,OpenAI在伦敦捅了开发者窝】相关内容,更多资讯请关注科技网

相关推荐相关推荐

快播:华硕预览CES 2025显示器阵容,涵盖ZenScreen、ROG Strix、ProArt系列

快播:华硕预览CES 2025显示器阵容,涵盖ZenScreen、ROG Strix、ProArt系列

大家好,今天小编来为大家解答【华硕预览CES 2025显示器阵容,涵盖ZenScreen、ROG Strix、ProArt系列】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 6 日消息,华硕官方昨日公布了将在明年 1 月初的 CES 2025 上推出的系列显示器产品 ...

智趣 4 2024-12-06
热点!AI商业化路上的9981难

热点!AI商业化路上的9981难

大家好,今天小编来为大家解答【AI商业化路上的9981难】这个问题,很多人还不知道,现在让我们一起来看看吧!文 | 李智勇不管海外还是国内,AI很难成功商业化。在企业级产品上海外似乎看到了些希望,国内则还有相对漫长的路要走。那为什么AI商业化如此艰 ...

智趣 5 2024-12-06
精彩看点:究竟是百度不行,还是苹果不行?

精彩看点:究竟是百度不行,还是苹果不行?

大家好,今天小编来为大家解答【究竟是百度不行,还是苹果不行?】这个问题,很多人还不知道,现在让我们一起来看看吧!这两天,外媒The Information发布的一则关于苹果和百度就AI合作的报道,掀起了轩然大波。简单概括下外媒报道中引发外界热议的几个关 ...

智趣 6 2024-12-06
人民财评:Meta与导演詹姆斯・卡梅隆旗下公司达成合作,将“彻底改变所有视觉媒体”

人民财评:Meta与导演詹姆斯・卡梅隆旗下公司达成合作,将“彻底改变所有视觉媒体”

大家好,今天小编来为大家解答【Meta与导演詹姆斯・卡梅隆旗下公司达成合作,将“彻底改变所有视觉媒体”】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 6 日消息,Meta 公司当地时间周四宣布,与电影导演詹姆斯・卡梅隆旗下的科技企业 ...

智趣 5 2024-12-06
「光明时评」AI算力军备竞赛,五大科技巨头屯了多少GPU?

「光明时评」AI算力军备竞赛,五大科技巨头屯了多少GPU?

大家好,今天小编来为大家解答【AI算力军备竞赛,五大科技巨头屯了多少GPU?】这个问题,很多人还不知道,现在让我们一起来看看吧!随着人工智能的加速发展,科技巨头之间掀起了一轮轮AI算力竞赛。日前,马斯克的xAI集群数据曝光,其正在推出基于10万个H1 ...

智趣 5 2024-12-06
热点话题:山姆京东名创加“仓”即时零售

热点话题:山姆京东名创加“仓”即时零售

大家好,今天小编来为大家解答【山姆京东名创加“仓”即时零售】这个问题,很多人还不知道,现在让我们一起来看看吧!回顾2024年的国内零售业,“变革”成为大大小小玩家的共同命题。山姆拓店冲刺“千亿”,胖东来“爆改”传统商超,叶国富入主永辉,阿里谋求出售 ...

智趣 4 2024-12-06
每日热门:迪思公关起诉哪吒汽车母公司合众新能源,涉案金额5355万元

每日热门:迪思公关起诉哪吒汽车母公司合众新能源,涉案金额5355万元

大家好,今天小编来为大家解答【迪思公关起诉哪吒汽车母公司合众新能源,涉案金额5355万元】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 6 日消息,福石控股于 12 月 5 日晚间发布公告,子公司北京迪思公关顾问有限公司因与合众新能 ...

智趣 3 2024-12-06
商业快评|realme真我Neo7手机将支持复杂动态高斯模糊效果

商业快评|realme真我Neo7手机将支持复杂动态高斯模糊效果

大家好,今天小编来为大家解答【realme真我Neo7手机将支持复杂动态高斯模糊效果】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 6 日消息,realme UI 产品经理 @康达 今日发文介绍了 realme UI 6.0 系统的视觉模糊设计,透露真我 Neo7 ...

智趣 7 2024-12-06
报道:王化回应“红枫”传闻:法务部已开始取证

报道:王化回应“红枫”传闻:法务部已开始取证

大家好,今天小编来为大家解答【王化回应“红枫”传闻:法务部已开始取证】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月6日消息,日前,博主“数码闲聊站”爆料称,小米15 Ultra将延期,不会在1月发布了。值得注意的是,网络上居然流传起一 ...

智趣 3 2024-12-06
精彩看点:8位数年薪!“最懂阿里大模型的人”带整个团队跳槽加入字节跳动

精彩看点:8位数年薪!“最懂阿里大模型的人”带整个团队跳槽加入字节跳动

大家好,今天小编来为大家解答【8位数年薪!“最懂阿里大模型的人”带整个团队跳槽加入字节跳动】这个问题,很多人还不知道,现在让我们一起来看看吧!11月13日早上,一则关于阿里巴巴决定申请仲裁“通义大模型前员工周畅违反竞业协议”的消息迅速在AI圈传播 ...

智趣 6 2024-12-06