奥特曼亲口承认 GPT-5.2 搞砸了,这是 OpenAI CEO 最特别的一次直播
奥特曼亲口承认 GPT-5.2 搞砸了,这是 OpenAI CEO 最特别的一次直播ChatGPT 最近明显又有点焦虑。
ChatGPT 最近明显又有点焦虑。
就在今天,OpenAI给肝论文的科研党送上了一份大礼——免费的科研写作平台Prism。 它把GPT-5.2模型深度集成到了在线LaTeX编辑器中,能够直接理解论文的完整结构、公式推导与参考文献。
深夜,OpenAI正式祭出新一代科研利器——Prism,由GPT-5.2加持,专为写作和协作而生。它是一个基于云的「AI原生」LaTeX工作区,不限项目和协作的人数。
阿里巴巴推出了Qwen3-Max-Thinking,这是阿里千问系列目前能力最强的旗舰级推理模型,在19项权威基准测试中,Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回,搭配测试时扩展(TTS)能力后,能在不少基准测试上达到SOTA。
面对琳琅满目的Deep Research Agent(深度研究智能体),究竟该如何选型?本文基于OSU与Amazon最新发布的MMDR-Bench论文,为您提供一份经过严谨科学验证的“避坑指南”。结论先行:综合任务首选谷歌Gemini Deep Research,而涉及计算机科学与数据结构的硬核任务,GPT-5.2依然是专家首选。
这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
AI证明数学猜想,这次来真的了。
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。结果?300万行代码。数千个文件。
刚刚,GPT-5.2刷新了一项新纪录!OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。
在人类满分都罕见的普特南数赛上,AI直接12题全对拿满分。陶哲轩等大佬预言AI已经取得了重要里程碑,再加上GPT-5.2 Pro在数学上强到「离谱」的表现,那种「奇点将近」的直觉,真的压不住了。