
模型即 Agent 的含金量:Kimi深度研究功能详评
模型即 Agent 的含金量:Kimi深度研究功能详评大家好,我是歸藏(guizang),今天给大家带来 Kimi 的深度研究能力体验和介绍。
大家好,我是歸藏(guizang),今天给大家带来 Kimi 的深度研究能力体验和介绍。
相信大家都用过 Kimi,也都用过 Kimi 的 PPT 助手——一键生成 PPT。但是随着各种功能更强、更好用的应用层出不穷,Kimi 近段时间的热度是越来越低了。
这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。
昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B。这个模型在软件工程任务基准测试SWE-bench Verified上取得了60.4%的成绩,创下开源模型新纪录,超越了包括DeepSeek在内的多个竞争对手。
深夜,沉寂已久的Kimi突然发布了新模型—— 开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。
AI应用一度火爆如文心一言、妙鸭相机和Kimi,但多因功能单一、收费激进、竞争激烈而快速沉寂;2025年行业进入理性阶段,转向用户价值与差异化,淘汰洗牌后聚焦长期留存和场景挖掘。
当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。
天才的标签之外杨植麟还是个资深文青。90后一代或多或少都曾迷恋过村上春树,1992年出生的杨植麟也不例外。在村上春树的一本小说中,杨植麟对一个程序员深夜写代码这件事印象深刻,并充满憧憬,这为他未来进入AI领域埋下伏笔。
“月之暗面给了我AGI信仰,但Kimi不是唯一的路。”
本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文中的创新点,读完会对 GRPO 及其改进算法有更深的理解,进而启发构建推理模型的新思路。