ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
o1图像理解神秘现身,网友疯狂测试!Altman自曝:o2研究生级水平破105%
3516点击    2024-11-03 14:52

o1图像理解,可用了?!



一大早,网友们纷纷晒出,自己获得了o1图像理解新功能。一大波测试,简直惊掉下巴。




小编测试了下,确实可用。仅需在模型选项中,选择ChatGPT 4o mini(非绝对),上传图片就可以了。



还有人解释了下原理,这一功能没有定向模型,有时还会切换。



几天前,OpenAI伦敦开发者日上,首次揭秘了未来完整版o1的五大能力,其中就包括:


函数调用、开发者message、流式传输、结构化输出、图像理解。



据称,这并非官方发布,可能是OpenAI底层微服务崩溃了,还没来得及修补。因为它本来打算作为内部私有服务使用。



先不管啥原因,直接用就完了。


现在,一大波o1图像理解测试,已经全网刷屏了。



o1最强图像理解,「解禁」了


自称是获得o1图像理解第一人,分享的一张聊天截图,让模型去分析。


o1解释道,「图片是聊天对话的截图,可以看到名为Bing的Al发送的两条信息」。



经过一番测试,他认为这就是完整版o1。



大咖歸藏(guizang.ai)用高中奥数测试一番,发现o1竟然答对了。




另一个有趣的案例。




一位网友表示,o1图像理解的推理速度,简直让人难以置信。


比如,分析一张海底光纤通信电缆地图,它通过多步思考准确给出,这些电缆横跨大洋,连接着世界上不同的大陆和地区。



不过遗憾的是,它还没有完全做好超越图像,实现全多模态理解的准备。


比如,网友上传了一个mp4视频,o1还无法读取。



还有网友直接给o1上了推理图形题,经过48秒的思考,最终给出了解答。



描述图片是什么,o1给出了一个完美解释。



再让它分析一张南瓜灯的图片,也准确答出了。



在另外一些简单视觉难题上,o1还是有困难。




推理新工具


除了图像理解能力,o1还新增了一个「Reasoning」新工具。


网友发现,在4o+canvas在,点击/就可以唤醒工具栏菜单,其中就包含了这个推理新工具。




不过需要注意的是,这个工具使用要通过以下的步骤:



- 在4o+canvas中附加文档


- 不要通过下拉菜单切换到o1-preview,否则会清除文件


- 输入/reson


- 按回车键


o2在研究生级别基准取得105%分?


更具玩味的是,Sam Altman还出来恶搞。


他发文表示,我听说,o2已经在GPQA上取得105%的成绩。(注意是小写字母)



紧接着,事情又来了反转,他表示算错了。要说这波营销,还的是奥特曼本尊。



评论区的网友纷纷追问道,o2什么时候放出?还有的人认为,OpenAI的更新实在是太慢了,早已急不可待。




不过,近日OpenAI的战略营销主管在采访中介绍了,OpenAI的步伐和品发布时间表正在加快。


这么看来,相较于以前,确实加速了不少。



参考资料:

https://x.com/ananayarora/status/1852666259478835458


文章来自于微信公众号“新智元”


关键词: o1 , o2 , 奥特曼 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda