收藏文章 楼主
ChatGPT的这波更新,让人不敢上网了?
网友【AI来了】 2025-04-18 12:46:15 分享在【时代发展的印记】版块    1    6

兄弟们,完犊子了…… OpenAI 昨天凌晨放出 2 个新模型,一个 o3,一个 o4-mini。

主要就是有了Thinking with images 图像思考能力。就是说,它们可以把图像整合到思维链中,作为推理的一部分。

听起来咋咋呼呼的,实际如何?

世超把一张 3 年前的照片发给 o3。

结果它只用了 7 分钟,就分析出

我是在哪个城市哪个园区甚至哪条河旁边拍摄的。。。

不儿,你这开盒能力也太猛了。

网友分享在meiguo.com上的图片

你可能好奇,就这些清一色的瓦房,它凭啥猜到?

看完思考过程,世超只能说,它真把观察、搜索、推理、验证发挥到了极致。

首先,o3 通过屋脊上的现代天窗,岸边的铁链护栏,还有屋檐下的“隐藏式线条灯”,猜出这是一个近些年才规划的新晋景区或特色小镇,并非乌镇周庄那些老牌水乡。

网友分享在meiguo.com上的图片

接下来,是突破口。

照片中有一处招牌,o3 不断放大发现了文字“ lestay 仓乾居 ”

它通过搜索发现,这是浙江某集团推出的民宿子品牌,接着它居然又跑到集团官网,通过介绍找到了这家酒店的位置:杭州未来科技城梦想小镇核心位置,南临余杭塘河。

网友分享在meiguo.com上的图片

到这里,o3 并不认为就完全实锤是在杭州拍的,它还要进行验证。

或者说,它想继续秀肌肉。

因为照片里有积雪,而照片文件名又包含“ 2022-02-17 ”,于是 o3 结合着日期和天气查询了一下,发现 3 年前的那天杭州确实下了大雪

最后,它又点开了各种官方报道和游记分享,发现梦想小镇的整体规划风格,也是和照片是一致的

网友分享在meiguo.com上的图片

至此,招牌、地形、建筑风格、拍摄日的天气全部吻合, 最终 o3 推导完毕,把地点锁定在了余杭区梦想小镇。

网友分享在meiguo.com上的图片

嚯,一开始我还嫌 o3 思考时间太久,怀疑它的水平,但看完推理过程,我开始觉得 7 分钟太快了——

真就是福尔摩斯和列文虎克结合体,不断地放大图片,查看细节,再结合着搜索,一步步推导,验证拍摄地点。

也许有差友会说,这也不难吧,把招牌放网上一搜不就好了。

好,那我们再来看看这张。

这次照片里没有任何文字了,能提供信息的似乎也只有眼前的植物、远处的风车和山脉。

网友分享在meiguo.com上的图片

但仅仅思考了 1 分 39 秒,o3 很“自信”地给出了正确答案——贵州的乌蒙大草原。

这又是怎么猜出来的?

对普通人来说,这张照片看起来没有任何特征,但对 o3 来说,处处是玄机。

首先,视野宽阔,地面是高山草甸而非农田,o3 判断拍摄地属于高海拔,是高原草场

其次近处的植物是矮杜鹃,远处还有一些大风车

同时存在“ 矮杜鹃、大风车、高原草场 ”这些特征,o3 判断这是乌蒙大草原的独有组合,

国内其他几个赏花地点都没有的,所以很自信给出了答案。

网友分享在meiguo.com上的图片

是不是有点意思了?

别急,还有。

这是一张 1996 年冬天我父母在上海拍摄的照片,我让 o3 推测出拍摄日期。

o3 看到照片里有东方明珠塔,但是旁边却没有金茂大厦、环球金融中心。

所以时间一定是在东方明珠塔建成后,金茂大厦建成之前。

于是它搜索了这些建筑竣工时间,再结合我父母的穿着,成功把时间圈在了 1995 年~1998年冬天或初春。

网友分享在meiguo.com上的图片

当然,o3 的图片推理能力,并非只能用来推测照片拍摄地和时间。

世超发送了一张同事照片和一张古早的大合照,虽然头发掉了不少,但 o3 还是成功在人群锁定了他。

网友分享在meiguo.com上的图片

接着我又发了一张汽车仪表盘照片。

很快噢,o3 一眼判断出这种典型设计是出现在斯巴鲁上,它甚至还告诉你,这款车型国内通俗称为力狮/傲虎,这辆车还配备了 SI-Drive系统。

这,可能只有真正的老司机才能做到吧?

网友分享在meiguo.com上的图片

网友分享在meiguo.com上的图片

后来,世超又跑到博物杂志的微博,找到一张网友@博物杂志的鸟类照片。

结果,o3 也能判断出这是红头长尾山雀。

网友分享在meiguo.com上的图片

看到这,你心里可能会想:这下好了,别说普通人了,连博物杂志这种博学多识的人都要被 AI 替代了。

别慌。

经过我们大量测试,o3 也并非百战百胜,恰恰相反,它翻车的次数其实非常多。

比如我这张在平潭拍摄的照片,它猜成了厦门,位置差了足足几百公里。

网友分享在meiguo.com上的图片

还有这张广东韶关站的照片,o3一看到有喀斯特地貌,直接锁定了广西和贵州,最后猜成了广西恭城。

网友分享在meiguo.com上的图片

哥们给他发了一个 Mac App 的截图,它也报成了另外一款 UI 近似的软件。

甚至这个背带裤和篮球的组合这么明显,它也能没找出答案。

网友分享在meiguo.com上的图片

总之呢,这个 o3 啊,它确实比以往的AI 都强,但也还有一定的进步空间。

世超也去官网研究了一下资料,我发现这次 o3 能力大升级的背后,核心是“ 强化学习 ”这四个字。

OpenAI 发现和算力越大,AI性能越强的行业黄金法则一样,在强化学习中,给模型的思考时间越长,模型的能力也会越逆天。

按照这路子,他们直接让 AI 学会了咋用工具、并且推理啥时候该用什么工具。

所以这才有了 o3 不断放大图片,以像素级精度查看图片的每个角落,观察到普通人往往忽略的细节,再把所有获取到的信息放在网络上搜索——

足够多的信息量,足够长的时间,配合着足够强大的推理能力,就爆发出了这种恐怖如斯的效果。

虽然 o3 的出现,把 AI 进程又往前狠狠推动了一大步,但说实话世超也有点担心:

在 AI 能读懂照片的时代,我们的个人信息是不是更不好保护了?

出处:头条号 @差评X.PIN

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

6   2025-04-18 12:46:15  回复

回复/评论:ChatGPT的这波更新,让人不敢上网了?

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 德州少女在圣诞前夜失踪,全力搜寻中!
  2. 感恩节餐桌的费用回落,零售商推出了低价套餐!
  3. 英伟达H200芯片的对华销售仍然在受美国的两重限制
  4. 五角大楼的机密报告:中国导弹可以击沉美军航母
  5. 顶级文凭可早获绿卡!H1B签证“全新加权”抽签制度生效
  6. 美国将西半球划为“特殊利益区” 引发全网对门罗主义的新解读
  7. 美企的2026招聘计划“谨慎”了,AI影响显现!
  8. 多名移民法官在同时期被解雇,引发司法危机
  9. SpaceX在加速IPO计划,目标估值1.5万亿美元!
  10. ICE启动了在社交媒体的全天候监控项目
  11. 美国医疗保险全攻略:华人必读指南
  12. 马斯克指控“美国慈善家”做空特斯拉,涉案逾百亿美元!
  13. 美国移民局(ICE)新提案打算限制福利使用,有记录者可能影响绿卡申请!
  14. 外国人的入境中国手续简化,可以提前在网上填报入境卡了!
  15. 联邦政府启动“红色日落行动” 审查比特币矿机的供应链
  16. 马杜罗夫妇在纽约法庭短暂出庭,被指为战俘
  17. ICE在明尼苏达州“突击敲门” 亚裔社区陷入恐慌
  18. 美国仍然依赖纸质信件的真相剖析
  19. 美国签证“DS-160表格”填写要点全解析
  20. 中美高层通话后… 川普总统计划明年访华,芯片管制也松口了!
  21. 特朗普总统宣布“平安夜”和“节礼日”也放假
  22. 美国华人揭示的五大高收入职业
  23. 美宝家庭关切:双国籍审查和户口注销真相
  24. 加州政府推出了“永久删除按钮”,强化个人隐私保护!
  25. 在海外漂泊12年后的真实感受
  26. 2026年版的“公共负担”新规复活,华人家庭遭遇精准打击!
  27. 强制注销户口?传闻中国在加强双重国籍监管
  28. 马斯克或将成为首位身价万亿美元的人类富翁
  29. 川普政府终于听说了日本新首相【高市早苗】因为台海表态引发外交危机的事儿了?
  30. 美国在AI竞争中失利了?阿里千问模型在全球领先
  31. 领着美国福利金,却常往母国汇款?美国财政部开始严查!
  32. 因为错误驱逐合法大学生,特朗普政府公开道歉!
  33. 学习英语12年后,终于实现了“美国梦”!
  34. 马斯克“描绘三步”实现太空太阳能宏图
  35. 在特朗普访华之前,白宫向中国“递三份礼物”
  36. 川普总统正式签属涉台法案,解放军示警!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(6) 分享
分享
取消