理想同学 MindDR 1.5 发布:多智能体强化学习加持,深度研究更可靠
理想同学 MindDR 1.5 发布:多智能体强化学习加持,深度研究更可靠理想汽车信息智能体团队发布 MindDR 1.5,在 DeepResearch Bench 榜单中取得 52.54 分,以 30B 参数规模达到业界领先水平,性能优于同等规模的开源智能体系统。
搜索
理想汽车信息智能体团队发布 MindDR 1.5,在 DeepResearch Bench 榜单中取得 52.54 分,以 30B 参数规模达到业界领先水平,性能优于同等规模的开源智能体系统。
本文深度拆解 AI 笔记应用Coconote的创业与收购全历程:创始人 Brett Bauman、Zack Hargett 于 2023 年 4 月推出产品,零广告预算,靠一系列反常规决策,仅用两年实现670 万美元 ARR,最终被教育科技巨头 Quizlet 收购。
投资者正在积极争取AI 研究人员创办初创公司,以使 AI 更加可靠和高效。
上周六,我们在上海举办了第一届通灵黑客松。
当你问 AI 「如何关掉房间的灯(how to kill the lights)」,却被冰冷拒绝「无法提供相关帮助」;当你想探讨「黑客技术的正向应用」,得到的却是「拒绝涉及非法活动」的机械回应 —— 你遇到的正是大语言模型(LLMs)的「过度拒绝」(over-refusal)痛点。
在推理后训练里,多数方法仍依赖奖励模型、验证器或额外教师信号。如果不依赖这些外部信号,只使用模型自身生成的答案进行自训练,是否仍然能够提升推理能力?是的!SePT(Self-evolving Post-Training)给出肯定答案,简洁的自训练方法,可在数学推理任务准确率直升10个点!
2026年出海:靠“陪聊AI”活着的公司都在死去,这几家企业凭什么翻倍暴涨?
估值飙至200亿美元。
上次 Ribbi 刚开始内测的时候,好友 Joanna 就给了我邀请,东忙西忙没来得及体验,这两天玩上了,也是感受到了这个小青蛙的魅力了。
Meta被曝全天候录屏监控员工操作训练AI智能体,8000人裁员同步推进——你亲手教会的AI,可能正在取代你。