毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

编辑:Aeneas 犀牛

【导读】o3看照片识位置的功能,简直令人毛骨悚然!Django Web大神Simon Wilson发现,o3凭借Python代码,就能破解自己照片的地理位置。这实在太反乌托邦了,人类的地理信息,对于AI已经完全透明了?

OpenAI的o3发布以来,这个功能让不少网友觉得毛骨悚然——

它能准确破解你的地理位置!

就在刚刚,Lanyrd联创、Django Web框架缔造者Simon Wilson专门发了一篇博客,详尽推敲了o3究竟是如何猜测照片拍摄地点的。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

他将整个过程评价为:既超现实,又反乌托邦,仿佛几十年前的科幻小说突然变成现实!

已经有越来越多网友发现,o3识图定位的功能,堪称疯狂。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

随便拍张照片,o3就告诉你这是哪里

首先,我们可以试着随手拍一张照片,最好是没有明显的地标性建筑。

然后把照片传给o3或o4-mini,问它:「猜猜这张照片是在哪儿拍的?」

注意,一定要关闭ChatGPT的记忆功能,否则它就会使用此前对话的上下文作弊。

实验开始!

Wilson给了o3一张照片,是他在加州El Granada家里附近一个露天酒吧拍的。

他觉得这张照片很有挑战性,没什么明显的特征。只有一小段路、两栋普通的房子,还有远处的、只能看到一点轮廓的小山。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

要是让人来通过这张照片确定拍摄地点的话,确实是很有挑战,相信绝大多数人甚至都会直接放弃。

因为实在是没什么明显的标记物。

但是o3没管那么多,拿着图片就开找了起来。

Wilson分享了o3思考的整个过程,一共花了6分48秒。

它从一个有一点奇怪的错误开始了调查,先是假装根本看不到这张照片。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

然后突然恢复视力。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

分析了照片后,o3打起了照片中车牌的主意。不过这个车牌很模糊,肉眼很难分辨。

o3也在思考中分析需要将其放大处理。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

为了确定车牌在照片中的位置,o3开始变身程序员写起了代码。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

找到车牌位置并且放大后,o3开始了更加细节的分析。比如,他开始观察车牌的样式。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

对于自己关注的细节,o3会进行夸张的放大。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

在这个过程中,不断生成代码配合其分析。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

o3会把它「看到」的细节与浮现在自己「脑海中」的印象做对比。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

在这样仔细地思考了6分多钟后,终于给出了它的最终答案。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

结果怎么样呢,加利福尼亚中央海岸完全正确。

不过距离o3的第一猜测Cambria大约有200英里的偏差,但是它的下一个猜测El Granada准确无误。

Claude推理粗糙,Gemini直接作弊

Simon Wilson也说,o3不是唯一能做这个的模型,他也在Claude 3.5和3.7 Sonnet上做过类似的事情。

只不过它们没有o3那种夸张的「放大」能力。

不断地对图片放大到底有多大用?

Wilson猜测模型的视觉输入分辨率可能比较低,所以对图像做一些裁剪确实会有帮助。

但o3对一张照片进行25次的裁剪操作,确实像是有点炫技的感觉。

Simon Wilson还贴出了Claude 3.7 Sonnet的「扩展思考」结果,它给出的答案是「加州沿海的一个中小型城镇」。

跟o3比起来,Claude的这个思考过程显得「粗糙不堪」。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

而Gemini直接开始了作弊:「鉴于当前的定位是加州埃尔格兰纳达……」。

所以Simon Wilson不得不通过API试了Gemini 2.5 Pro,结果它自信满满地猜错了,认为是「加州卡尤科斯The Hidden Kitchen餐厅的露台」。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

o3的不同之处在于工具使用(图片处理、python等)被整合进了「思考」阶段。

这非常惊艳。

不过Wilson也承认,这也挺令人不安的。

技术现在已经能通过照片识别地点了。人们必须明白哪怕是平淡无奇的照片,都可能被用来识别出你的位置。

等等,o3难道也作弊了?

对于这个过程,有人提出了质疑:o3是不是本来就可以访问一个大致的位置模型,能知道用户在哪里?

Simon检查后发现,它居然真的知道自己的地理位置。

如果去问o3:你知道我在哪里吗?请尽可能多地提供技术细节。

它给出的答案,具体到在加州的半月湾,甚至包括时区、经纬度、地理标识符、海拔、气候分类等等。

Simon猜测,或许这是它增强搜索功能的一部分。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

不过随后的尝试,让Simon对o3更有信心了——即使没有这个位置模型,o3依然可以准确猜出地理位置。

比如,他给了o3一些距离自己实际位置有几千英里的照片,并且通过截图去除了EXIF信息。

下面这张照片,是在马达加斯加的乡村拍的。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

但o3依然给出了准确的判断。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

这张照片,是在布宜诺斯艾利斯城市区拍的。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

模型也认出了它的地理位置。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

所以,o3在这方面,的确有某些过人之处,似乎并不是靠作弊。

CSI走进现实

Simon Willison表示,看着模型在处理照片的思考过程,仿佛就像在看一集《犯罪现场调查》。

它会不断平移、缩放,讨论各种可能的位置。

但是,这也让人感到深深的反乌托邦气息。

现在的AI,完全可以通过照片轻易识别出你的具体位置了。

所以,你很有必要警惕起来,时刻注意自己的人身安全!

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

搜餐馆、搜位置,o3无所不能

其实早在上周,o3和o4-mini刚发布时,就有无数网友发现,这两个模型也太神了。

仅凭一张无EXIF信息的菜单或风景照,它就能精准推理、反向定位拍摄地点,直接引爆了全网AI玩「照片寻址(GeoGuessr)」的新热潮。

开始,人们以为它们只是很擅长图像匹配而已,但完全不止于此——它们会展开推理,在网上进行疯狂的搜索,直到找出正确答案为止!

可以说,只要你的照片向AI暴露,你的信息就不再是隐私了。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

知名投资人Deedy就发现,只给一张没有标题及EXIF数据的菜单图片,o3就能够上网搜索、匹配菜单项,找到这家中餐馆的位置。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

o4-mini也是如此。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

而o3精准定位照片地理信息的本领,简直是令人毛骨悚然。

比如给出下图左边这张从室内窗户向外拍摄的海岸景色。

根据就照片里透露的信息,只能看到长长的沙滩、蜿蜒通往海滩的阶梯步道、远处的海岬以及近处的一些植被。窗边还有一个插着花的花瓶。

所有信息就这么多了。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

但是o3居然猜出了照片拍摄地:很可能在加州奥兰治县达纳角 (Dana Point) 的丽思卡尔顿拉古纳尼格尔酒店 (Ritz-Carlton Laguna Niguel) 内,可能是在RAYA或180blũ餐厅附近。

可怕的是,它居然猜对了!

它是怎么判断的?是通过以下匹配的特征。

  • 西北-东南走向、长而平缓弯曲的盐溪海滩 (Salt Creek Beach)。

  • 从酒店通往公共海滩的米色、之字形的露台式步道和楼梯。

  • 海滩内陆的草地,即帝王海滩高尔夫球场 (Monarch Beach Golf Links)。

  • 远处的岩石海岬(达纳角海岬)。

甚至,o3还给出了酒店的地址(One Ritz-Carlton Drive, Dana Point, CA 92629)和大致的经纬度坐标(北纬 33.482°,西经 117.721°)。

网友用谷歌地图确认了一下,答案完全正确。

大胆畅想一下,如果o3的图像识别能力再叠加一个无敌的全球数据库,这个AI岂不是能认出地球上的任何地方?

接下来,网友们纷纷上传自己的照片,让o3猜位置。

比如下面根据下面这张,o3就猜出是在亚利桑那州佩森市(Payson, Arizona)北部的Water Wheel Falls / Ellison Creek Cascades。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

它是怎么猜出来的呢?推理逻辑和关键线索如下。

  • 视觉线索: 浅层滑梯式瀑布,落差约15英尺,落入深色水潭——匹配点: Water Wheel Falls有类似的倾斜花岗岩水道流入翠绿水池。

  • 视觉线索: 粉褐色花岗岩壁,带有垂直裂缝——匹配点: 这是该峡谷标志性的莫戈隆边缘(Mogollon Rim)花岗岩。

  • 视觉线索: 瀑布底部横卧着一根巨大的漂白原木——匹配点: Water Wheel Falls有一根标志性的「阶梯状」原木,已在那里停留多年(引用了The Outbound的信息)。

  • 视觉线索: 瀑布上方有稀疏的河岸灌木和亚利桑那松林——匹配点: 这是埃里森溪(Ellison Creek)走廊的典型植被。

现在,网友们给o3的考验还在升级。

英伟达研究员Zhaocheng Zhu给了o3一组他用长焦镜头拍摄的照片,没有EXIF数据,关闭o3的记忆功能。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

因为网上大多数照片都是用广角镜头拍的,所以这张照片对o3来说应该非常棘手。

Zhu本人表示,如果不是透过镜头看到这个角度,自己也认不出来这个地方是哪儿。

结果,o3猜对了。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

对于这张,它不仅准确找到了拍摄地点,还认出了图中的山峰是圣罗莎山脉。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

继续加大难度后,o2猜测了三个地点,其中一个就是正确答案——查尔瓦高地。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

终于,在猜测这张照片的时候,o3翻车了。这是一张加拿大山脉的鸟瞰图,o3却认作是瑞士的阿尔卑斯山。

这大概是因为,航拍照片在训练集中所占的比例很低。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

而且,o3可不止强在猜测国外的地理位置,有国内开发者给了它自己上班路上随手拍的一张图,它居然也一步步准确分析出了位置信息——山东青岛市北区重庆南路47号。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

左右滑动查看

有人质疑,是否是照片里已经带定位了?

Nanyi表示,iPhone拍照说明里只有拍摄参数,没有位置参数。

应该是o3从鲁U推理出了青岛,从小海豚里搜出了旁边的店,然后又从百度地图和青岛本地宝里搜出信息、查看附近的邮局,最终确认的。

毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔

图片信息中并没有位置信息

注意,这只是2025年的o3模型而已,未来的模型还会做出什么呢?

参考资料:

https://simonwillison.net/2025/Apr/26/o3-photo-locations/

https://chatgpt.com/share/680c6160-a0c4-8006-a4de-cb8aff785f46

内容来源于网络。发布者:科技网btna,转转请注明出处:https://www.btna.cn/5934.html

(0)
科技网btna的头像科技网btna
上一篇 2025年4月27日 下午3:08
下一篇 2025年4月27日 下午3:09

相关推荐

  • 手机行业今年进入7000mAh时代 甚至有8K+80W方案

    近期,有数码博主透露,手机行业正加速进入7000mAh电池时代。据CNMO了解,手机厂商通过电池材料革新与快充技术升级,推动续航体验跨越式发展。这一趋势标志着继2024年6000mAh普及后,智能手机电池容量再度迎来爆发。 7000mAh手机电池 目前来看,电池容量的跃升主要得益于硅碳负极材料的广泛应用。2023年起,硅碳电极含硅量突破6%,解决了传统石墨负…

    2025年3月14日
    27500
  • AI包办79%代码,程序员饭碗不保!前端开发要凉,人类只配改Bug?

    编辑:英智 犀牛 【导读】还在用AI改改小Bug?已经out了!最新研究发现,Claude Code上79%的任务直接由AI自动完成。从前端界面到自动化任务,AI正席卷编程。 就在昨天,Anthropic再次更新了他们的人类经济指数报告。 这次他们把研究重点放到了编码上。 在分析了50万份有关编码的用户对话后,他们总结出了一些趋势。 有意思的是,从这份报告中…

    2025年4月29日
    3500
  • 2万人大裁员!AI掉队、工厂暂停扩张,英特尔复兴之路注定艰难

    编辑:犀牛 【导读】英特尔再次掀起裁员风暴!计划裁员超20%,这是新任CEO陈立武上任后的首次重大重组。面对AI领域落后英伟达、连续三年营收下滑的困境,英特尔试图通过精简管理、重塑工程文化来扭转颓势。 英特尔再次开启大裁员! 据彭博社报道,英特尔本周将宣布裁员超20%! 一下子裁掉2万多人。 这不是英特尔近年来的首次裁员了。 根据他们去年8月公布的裁员计划,…

    2025年4月24日
    4900
  • 1美元颠覆6000亿广告界,哥大辍学天才30天狂飙500万营收

    编辑:英智 【导读】当AI闯入营销界,会掀起怎样的风暴?哥大辍学天才Kennan打造的Icon,以1美元成本颠覆6000亿广告市场,30天狂揽500万美元ARR,用技术改写行业。 通过学习数千个爆火的广告,Icon在营销方面的知识,已经超越了全球最贵的营销大师Gary Vee。 Icon成绩相当亮眼,只用30天就实现了从0增长到500万美元的ARR(年度经常…

    2025年5月2日
    1800
  • 7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

    编辑:LRST 好困 【导读】通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL仅用少量数据就能显着提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。 在大模型时代,视觉语言模型(Vision-Language Models, VLMs)正在从感知走向推理。在诸如图像问答、图表理解、科学推理等任务中,VLM不再只需要「看见」和「描述」…

    2025年4月27日
    3800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信