o1图像理解,可用了?!
一大早,网友们纷纷晒出,自己获得了o1图像理解新功能。一大波测试,简直惊掉下巴。
小编测试了下,确实可用。仅需在模型选项中,选择ChatGPT 4o mini(非绝对),上传图片就可以了。
还有人解释了下原理,这一功能没有定向模型,有时还会切换。
几天前,OpenAI伦敦开发者日上,首次揭秘了未来完整版o1的五大能力,其中就包括:
函数调用、开发者message、流式传输、结构化输出、图像理解。
据称,这并非官方发布,可能是OpenAI底层微服务崩溃了,还没来得及修补。因为它本来打算作为内部私有服务使用。
先不管啥原因,直接用就完了。
现在,一大波o1图像理解测试,已经全网刷屏了。
自称是获得o1图像理解第一人,分享的一张聊天截图,让模型去分析。
o1解释道,「图片是聊天对话的截图,可以看到名为Bing的Al发送的两条信息」。
经过一番测试,他认为这就是完整版o1。
大咖歸藏(guizang.ai)用高中奥数测试一番,发现o1竟然答对了。
另一个有趣的案例。
一位网友表示,o1图像理解的推理速度,简直让人难以置信。
比如,分析一张海底光纤通信电缆地图,它通过多步思考准确给出,这些电缆横跨大洋,连接着世界上不同的大陆和地区。
不过遗憾的是,它还没有完全做好超越图像,实现全多模态理解的准备。
比如,网友上传了一个mp4视频,o1还无法读取。
还有网友直接给o1上了推理图形题,经过48秒的思考,最终给出了解答。
描述图片是什么,o1给出了一个完美解释。
再让它分析一张南瓜灯的图片,也准确答出了。
在另外一些简单视觉难题上,o1还是有困难。
除了图像理解能力,o1还新增了一个「Reasoning」新工具。
网友发现,在4o+canvas在,点击/就可以唤醒工具栏菜单,其中就包含了这个推理新工具。
不过需要注意的是,这个工具使用要通过以下的步骤:
- 在4o+canvas中附加文档
- 不要通过下拉菜单切换到o1-preview,否则会清除文件
- 输入/reson
- 按回车键
更具玩味的是,Sam Altman还出来恶搞。
他发文表示,我听说,o2已经在GPQA上取得105%的成绩。(注意是小写字母)
紧接着,事情又来了反转,他表示算错了。要说这波营销,还的是奥特曼本尊。
评论区的网友纷纷追问道,o2什么时候放出?还有的人认为,OpenAI的更新实在是太慢了,早已急不可待。
不过,近日OpenAI的战略营销主管在采访中介绍了,OpenAI的步伐和品发布时间表正在加快。
这么看来,相较于以前,确实加速了不少。
参考资料:
https://x.com/ananayarora/status/1852666259478835458
文章来自于微信公众号“新智元”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda