Agent不会搞科研?人大微软开源框架&工具包解决盲目试错通病,抱抱脸日榜第一
Agent不会搞科研?人大微软开源框架&工具包解决盲目试错通病,抱抱脸日榜第一写代码、跑实验、改项目、迭代方案,现在的AI智能体样样都能搞定。
搜索
写代码、跑实验、改项目、迭代方案,现在的AI智能体样样都能搞定。
DeNovoSWE是一个用于训练代码智能体从零生成完整仓库的数据集,包含4818个真实任务实例。它通过结构化文档和严格验证机制,帮助智能体掌握复杂系统构建能力,而不仅仅是修复代码。这为代码智能体迈向更高阶的软件工程任务提供了关键支持。
当 AI 智能体(Agent)从实验室走向真实应用,我们面对的安全问题也正在发生变化。
一个模型能模拟7种环境。
豆包大模型2.1 Pro正式发布。但字节这次没有像某些厂商那样疯狂堆参数、刷榜单,而是把刀锋对准了一个更硬核的方向:让AI真正能“干活” 。作为本次大会发布的主力模型,豆包2.1 Pro 在 Coding(编程)、Agent(智能体)、VLM(视觉语言模型)三大核心方向实现能力跃升,多项评测表现优于Claude Opus 4.6
SoulAgent要做的是一个真正面向个人的专属智能体:越用越懂你。微信小程序或网页登录后,它就开始记录你、理解你、替你感知世界。未来,每个人都能拥有持续进化的专属数字分身。
做了一年 Agent 基础设施,踩了无数坑,我终于想明白了一件事:好的 Agent 架构不是把所有功能塞进一个进程,而是让每一层都能独立演化。
当 AI 智能体真正开始干活,它的每一次请求,都要经过一个你看不见的「中间人」。
据悉,AI 推理芯片公司上海淬思科技有限公司(Trace Intelligence,以下简称“淬思”)近日完成孵化轮融资,砺思资本(Monolith)与启盈同创基金联合领投。本轮资金将用于首款面向智能体(Agent)推理的专用芯片研发与流片,以及核心团队扩充。
近期,在 LangChain 举办的智能体大会 Interrupt 上,吴恩达与 LangChain 创始人 Harrison Chase 进行了一场关于 AI Agent 的对谈。整场交流的核心并不是简单讨论 Agent 有多强,而是围绕一个更现实的问题展开:当 AI Agent 让软件开发变快之后,真正的瓶颈会转移到哪里?