DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升
DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升用代码训练大模型思考,其他方面的推理能力也能提升。
来自主题: AI技术研报
6013 点击 2025-02-18 10:40
搜索
用代码训练大模型思考,其他方面的推理能力也能提升。
Grok 3 的表现究竟如何?
信息大爆炸是我一直在思考的问题。毕竟跟我自己的媒体专业相关,看到的更多一点。新年的第一周,我跟 Y 同学一起讨论出了我作为媒体老编辑相对满意的 AI 方案。跟大家分享一下。
AI“下沉”北方小城
基于三家企业、127 页文字访谈实录总结的产业观察
AI让定制化服务成为可能
36氪获悉,具身智能创业公司“自变量机器人(X Square Robot)”完成数亿元Pre-A++轮融资。本轮融资由光速光合与君联资本领投、北京机器人产业基金、神骐资本跟投。融资将用于下一代统一具身智能通用大模型的训练与场景落地。
“AI+”及泛AI方向研报激增
接入DeepSeek,不等于All in DeepSeek
尽管多模态大模型在通用视觉理解任务中表现出色,但不具备细粒度视觉识别能力,这极大制约了多模态大模型的应用与发展。针对这一问题,北京大学彭宇新教授团队系统地分析了多模态大模型在细粒度视觉识别上所需的 3 项能力:对象信息提取能力、类别知识储备能力、对象 - 类别对齐能力,发现了「视觉对象与细粒度子类别未对齐」