毛骨悚然！o3精准破译照片位置，只靠几行Python代码？人类在AI面前已裸奔

科技网btna • 2025年4月27日下午3:09 • 智能 • 阅读 77

编辑：Aeneas 犀牛

【导读】o3看照片识位置的功能，简直令人毛骨悚然！Django Web大神Simon Wilson发现，o3凭借Python代码，就能破解自己照片的地理位置。这实在太反乌托邦了，人类的地理信息，对于AI已经完全透明了？

OpenAI的o3发布以来，这个功能让不少网友觉得毛骨悚然——

它能准确破解你的地理位置！

就在刚刚，Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客，详尽推敲了o3究竟是如何猜测照片拍摄地点的。

他将整个过程评价为：既超现实，又反乌托邦，仿佛几十年前的科幻小说突然变成现实！

已经有越来越多网友发现，o3识图定位的功能，堪称疯狂。

随便拍张照片，o3就告诉你这是哪里

首先，我们可以试着随手拍一张照片，最好是没有明显的地标性建筑。

然后把照片传给o3或o4-mini，问它：「猜猜这张照片是在哪儿拍的？」

注意，一定要关闭ChatGPT的记忆功能，否则它就会使用此前对话的上下文作弊。

实验开始！

Wilson给了o3一张照片，是他在加州El Granada家里附近一个露天酒吧拍的。

他觉得这张照片很有挑战性，没什么明显的特征。只有一小段路、两栋普通的房子，还有远处的、只能看到一点轮廓的小山。

要是让人来通过这张照片确定拍摄地点的话，确实是很有挑战，相信绝大多数人甚至都会直接放弃。

因为实在是没什么明显的标记物。

但是o3没管那么多，拿着图片就开找了起来。

Wilson分享了o3思考的整个过程，一共花了6分48秒。

它从一个有一点奇怪的错误开始了调查，先是假装根本看不到这张照片。

然后突然恢复视力。

分析了照片后，o3打起了照片中车牌的主意。不过这个车牌很模糊，肉眼很难分辨。

o3也在思考中分析需要将其放大处理。

为了确定车牌在照片中的位置，o3开始变身程序员写起了代码。

找到车牌位置并且放大后，o3开始了更加细节的分析。比如，他开始观察车牌的样式。

对于自己关注的细节，o3会进行夸张的放大。

在这个过程中，不断生成代码配合其分析。

o3会把它「看到」的细节与浮现在自己「脑海中」的印象做对比。

在这样仔细地思考了6分多钟后，终于给出了它的最终答案。

结果怎么样呢，加利福尼亚中央海岸完全正确。

不过距离o3的第一猜测Cambria大约有200英里的偏差，但是它的下一个猜测El Granada准确无误。

Claude推理粗糙，Gemini直接作弊

Simon Wilson也说，o3不是唯一能做这个的模型，他也在Claude 3.5和3.7 Sonnet上做过类似的事情。

只不过它们没有o3那种夸张的「放大」能力。

不断地对图片放大到底有多大用？

Wilson猜测模型的视觉输入分辨率可能比较低，所以对图像做一些裁剪确实会有帮助。

但o3对一张照片进行25次的裁剪操作，确实像是有点炫技的感觉。

Simon Wilson还贴出了Claude 3.7 Sonnet的「扩展思考」结果，它给出的答案是「加州沿海的一个中小型城镇」。

跟o3比起来，Claude的这个思考过程显得「粗糙不堪」。

而Gemini直接开始了作弊：「鉴于当前的定位是加州埃尔格兰纳达……」。

所以Simon Wilson不得不通过API试了Gemini 2.5 Pro，结果它自信满满地猜错了，认为是「加州卡尤科斯The Hidden Kitchen餐厅的露台」。

o3的不同之处在于工具使用（图片处理、python等）被整合进了「思考」阶段。

这非常惊艳。

不过Wilson也承认，这也挺令人不安的。

技术现在已经能通过照片识别地点了。人们必须明白哪怕是平淡无奇的照片，都可能被用来识别出你的位置。

等等，o3难道也作弊了？

对于这个过程，有人提出了质疑：o3是不是本来就可以访问一个大致的位置模型，能知道用户在哪里？

Simon检查后发现，它居然真的知道自己的地理位置。

如果去问o3：你知道我在哪里吗？请尽可能多地提供技术细节。

它给出的答案，具体到在加州的半月湾，甚至包括时区、经纬度、地理标识符、海拔、气候分类等等。

Simon猜测，或许这是它增强搜索功能的一部分。

不过随后的尝试，让Simon对o3更有信心了——即使没有这个位置模型，o3依然可以准确猜出地理位置。

比如，他给了o3一些距离自己实际位置有几千英里的照片，并且通过截图去除了EXIF信息。

下面这张照片，是在马达加斯加的乡村拍的。

但o3依然给出了准确的判断。

这张照片，是在布宜诺斯艾利斯城市区拍的。

模型也认出了它的地理位置。

所以，o3在这方面，的确有某些过人之处，似乎并不是靠作弊。

CSI走进现实

Simon Willison表示，看着模型在处理照片的思考过程，仿佛就像在看一集《犯罪现场调查》。

它会不断平移、缩放，讨论各种可能的位置。

但是，这也让人感到深深的反乌托邦气息。

现在的AI，完全可以通过照片轻易识别出你的具体位置了。

所以，你很有必要警惕起来，时刻注意自己的人身安全！

搜餐馆、搜位置，o3无所不能

其实早在上周，o3和o4-mini刚发布时，就有无数网友发现，这两个模型也太神了。

仅凭一张无EXIF信息的菜单或风景照，它就能精准推理、反向定位拍摄地点，直接引爆了全网AI玩「照片寻址（GeoGuessr）」的新热潮。

开始，人们以为它们只是很擅长图像匹配而已，但完全不止于此——它们会展开推理，在网上进行疯狂的搜索，直到找出正确答案为止！

可以说，只要你的照片向AI暴露，你的信息就不再是隐私了。

知名投资人Deedy就发现，只给一张没有标题及EXIF数据的菜单图片，o3就能够上网搜索、匹配菜单项，找到这家中餐馆的位置。

o4-mini也是如此。

而o3精准定位照片地理信息的本领，简直是令人毛骨悚然。

比如给出下图左边这张从室内窗户向外拍摄的海岸景色。

根据就照片里透露的信息，只能看到长长的沙滩、蜿蜒通往海滩的阶梯步道、远处的海岬以及近处的一些植被。窗边还有一个插着花的花瓶。

所有信息就这么多了。

但是o3居然猜出了照片拍摄地：很可能在加州奥兰治县达纳角 (Dana Point) 的丽思卡尔顿拉古纳尼格尔酒店 (Ritz-Carlton Laguna Niguel) 内，可能是在RAYA或180blũ餐厅附近。

可怕的是，它居然猜对了！

它是怎么判断的？是通过以下匹配的特征。

西北-东南走向、长而平缓弯曲的盐溪海滩 (Salt Creek Beach)。
从酒店通往公共海滩的米色、之字形的露台式步道和楼梯。
海滩内陆的草地，即帝王海滩高尔夫球场 (Monarch Beach Golf Links)。
远处的岩石海岬（达纳角海岬）。

甚至，o3还给出了酒店的地址（One Ritz-Carlton Drive, Dana Point, CA 92629）和大致的经纬度坐标（北纬 33.482°，西经 117.721°）。

网友用谷歌地图确认了一下，答案完全正确。

大胆畅想一下，如果o3的图像识别能力再叠加一个无敌的全球数据库，这个AI岂不是能认出地球上的任何地方？

接下来，网友们纷纷上传自己的照片，让o3猜位置。

比如下面根据下面这张，o3就猜出是在亚利桑那州佩森市（Payson, Arizona）北部的Water Wheel Falls / Ellison Creek Cascades。

它是怎么猜出来的呢？推理逻辑和关键线索如下。

视觉线索：浅层滑梯式瀑布，落差约15英尺，落入深色水潭——匹配点： Water Wheel Falls有类似的倾斜花岗岩水道流入翠绿水池。
视觉线索：粉褐色花岗岩壁，带有垂直裂缝——匹配点：这是该峡谷标志性的莫戈隆边缘（Mogollon Rim）花岗岩。
视觉线索：瀑布底部横卧着一根巨大的漂白原木——匹配点： Water Wheel Falls有一根标志性的「阶梯状」原木，已在那里停留多年（引用了The Outbound的信息）。
视觉线索：瀑布上方有稀疏的河岸灌木和亚利桑那松林——匹配点：这是埃里森溪（Ellison Creek）走廊的典型植被。

现在，网友们给o3的考验还在升级。

英伟达研究员Zhaocheng Zhu给了o3一组他用长焦镜头拍摄的照片，没有EXIF数据，关闭o3的记忆功能。

因为网上大多数照片都是用广角镜头拍的，所以这张照片对o3来说应该非常棘手。

Zhu本人表示，如果不是透过镜头看到这个角度，自己也认不出来这个地方是哪儿。

结果，o3猜对了。

对于这张，它不仅准确找到了拍摄地点，还认出了图中的山峰是圣罗莎山脉。

继续加大难度后，o2猜测了三个地点，其中一个就是正确答案——查尔瓦高地。

终于，在猜测这张照片的时候，o3翻车了。这是一张加拿大山脉的鸟瞰图，o3却认作是瑞士的阿尔卑斯山。

这大概是因为，航拍照片在训练集中所占的比例很低。

而且，o3可不止强在猜测国外的地理位置，有国内开发者给了它自己上班路上随手拍的一张图，它居然也一步步准确分析出了位置信息——山东青岛市北区重庆南路47号。

左右滑动查看

有人质疑，是否是照片里已经带定位了？

Nanyi表示，iPhone拍照说明里只有拍摄参数，没有位置参数。

应该是o3从鲁U推理出了青岛，从小海豚里搜出了旁边的店，然后又从百度地图和青岛本地宝里搜出信息、查看附近的邮局，最终确认的。

图片信息中并没有位置信息

注意，这只是2025年的o3模型而已，未来的模型还会做出什么呢？

参考资料：

https://simonwillison.net/2025/Apr/26/o3-photo-locations/

https://chatgpt.com/share/680c6160-a0c4-8006-a4de-cb8aff785f46

内容来源于网络。发布者：科技网btna，转转请注明出处：https://www.btna.cn/5934.html

赞 (0)

0 0

一行代码不用写，AI看论文自己「生」出代码库！科研神器再+1

上一篇 2025年4月27日下午3:08

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

下一篇 2025年4月27日下午3:09

智能

强化学习被高估！清华上交：RL不能提升推理能力，新知识得靠蒸馏

编辑：编辑部 NXs 【导读】一项来自清华大学和上海交通大学的研究颠覆了对可验证奖励强化学习（RLVR）的认知。RLVR被认为是打造自我进化大模型的关键，但实验表明，它可能只是提高了采样效率，而非真正赋予模型全新推理能力。最近，以推理能力为核心的大语言模型已然成为了主流，比如OpenAI o系列模型、DeepSeek-R1等等。推理模型在处理数学和编程等…

科技网btna
2025年4月26日
62000
智能

从游戏少女到AI女神！她用物理驯服AI，让飓风预测快1000倍

编辑：英智【导读】25年前，10岁的Rose Yu收到一台改变命运的电脑，从玩游戏到成为AI领域的领军人物，她如何用物理学与深度学习破解交通、飓风和核聚变的难题？跟随她的脚步，揭秘一位天才科学家的开挂人生！ 10岁那年，Rose Yu收到一份改变命运的生日礼物——一台电脑。在25年前，电脑在中国可是稀罕物。这份来自叔叔的礼物，从此开启了她开挂般的人生！ …

科技网btna
2025年5月2日
68000
智能

奥特曼：我不会让儿子和AI交朋友！与丈夫的家庭生活首曝光

编辑：Aeneas 好困【导读】最近，奥特曼再次出席美国国会山听证会。他对美国政府呼吁：一定要放开监管，过早设定标准，对美国AI将是一场灾难！另外他还透露，OpenAI第一个开源模型，会在今年夏天发布。值得一提的是，奥特曼神秘的家庭生活，也在一位记者的亲身探寻下，让我们窥到了一斑。 2025年，奥特曼再次走入美国国会山。就在昨天，美国参议院就「美国在AI…

科技网btna
2025年5月10日
72000
智能

GPT-4o偷偷升级，变身聊天鬼才！新版STEM智力飙升，生图却惨遭削弱？

编辑：桃子好困【导读】GPT-4o又双叒更新了。这一次，在智力和个性方面再次进化，STEM解决能力增强，响应更主动。与此同时，有人曝出它的生图质量大不如前。 OpenAI又默默地更新了模型。前一天，奥特曼发文称更新后的GPT-4o，在智力和个性方面有了很大的提升。在更新公告中，GPT-4o还优化了保存记忆的时间，增强了STEM领域问题解决能力。同时…

科技网btna
2025年4月27日
82000
智能

GPT-4.5功臣遭驱逐！奥特曼盛赞工作出色，美国深陷AI人才危机

编辑：犀牛好困【导读】近日，GPT-4.5核心开发者之一的Kai Chen因绿卡申请被拒，面临被迫离开美国的困境。与此同时，1700多名国际学生和研究人员因签证审查受阻，Nature调查显示75%的美国科学家正考虑逃离。这种人才流失或将影响美国在全球AI领域的领先地位。 GPT-4.5的核心研发成员，竟然要被驱逐出美国？！ OpenAI着名研究科学家No…

科技网btna
2025年4月26日
87000

发表回复

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信