Agent微调复活?英伟达开源8B新模型带飞GPT-5:在HLE狂卷37分,还把成本打下来
Agent微调复活?英伟达开源8B新模型带飞GPT-5:在HLE狂卷37分,还把成本打下来当问题又深又复杂时,一味上最强模型既贵又慢。测试时扩展能想得更久,却不一定想得更对。
当问题又深又复杂时,一味上最强模型既贵又慢。测试时扩展能想得更久,却不一定想得更对。
紧急反击!自从谷歌放出Gemini 3之后,OpenAI快被逼疯了,奥特曼甚至宣布公司进入了「红色警戒」状态。据The Verge爆料,熟悉OpenAI计划的消息人士透露,OpenAI将在下周(12月9号)发布GPT-5.2,首次对Gemini 3做出正面回应。
密歇根州立大学物理学家Stephen Hsu刚刚在《Physics Letters B》上发表了一篇量子物理论文,核心思想由GPT-5从零提出,这可能是第一篇主要想法来自AI的理论物理研究论文。作者本人也在社交媒体上确认了这一点:
DeepWisdom研究团队提出:视频生成模型不仅能画画,更能推理。 为了验证这一观点,团队推出了VR-Bench——这是首个通过迷宫任务评估视频模型空间推理(spatial reasoning)能力的基准测试
全球首个可大规模落地的开源原生多模态架构(Native VLM),名曰NEO。要知道,此前主流的多模态大模型,例如我们熟悉的GPT-4V、Claude 3.5等,它们的底层逻辑本质上其实玩的就是拼接。
想象你在准备早餐:你不会先写一份详细到「左手抓鸡蛋、右手拿碗、手腕旋转 45 度敲击蛋壳」这样的清单,也不会只有一个笼统的计划叫「做个早餐」,然后不知所措。
OpenAI真的急了!最新代码截图流出,一款全新「企鹅」家族模型秘密测试,有四款推理预算不同的模型。说不定不用等到明年,就能看到GPT-5.2出世了。
OpenAI搞了个新活:让ChatGPT自己“坦白从宽”。
ChatGPT发布三周年,OpenAI没发布,各大AI玩家倒纷纷整出大活。
面对谷歌攻势,OpenAI内部炸锅了。