
复杂Agent怎么设计?IBM用一个YAML,性能提升4倍| ICML 2025
复杂Agent怎么设计?IBM用一个YAML,性能提升4倍| ICML 2025您有没有遇到过这样的场景:为了调试一个LLM应用的效果,您需要在一大堆Python代码中翻找那些零散的提示词字符串?每次想要A/B测试不同的提示时,就像在做开颅手术一样小心翼翼。
您有没有遇到过这样的场景:为了调试一个LLM应用的效果,您需要在一大堆Python代码中翻找那些零散的提示词字符串?每次想要A/B测试不同的提示时,就像在做开颅手术一样小心翼翼。
北斗智影发布AI“七星Agent”加速短剧出海
2025上半年AI Agent领域经历模型竞争加剧和范式演进,DeepSeek等新模型打破垄断,推动Tool Use和强化学习突破。Agent从Prompt、Workflow发展为自主决策、环境感知和工具使用的智能体。编程领域验证PMF,落地机会集中于垂直场景和C端创新,但商业壁垒和技术挑战仍待解决。
汪渊 Raymond 已经重新开始创业,而且方向是当红的 AI 应用,公司名叫:Orion Arm,主体注册在新加坡,主做海外市场。Orion Arm 最近刚刚完成一笔 1100 万美元融资,投后估值 1 亿美元。有趣的是,他们做的不是 Agent,不是当前热门的那些领域,而是纯粹的工具Orion Arm 发布了两款 AI 工具:日程管理类的 Toki 和新闻聚合类的 Syft。
Manus,真的从国内撤了?4个月前一夜蹿红起飞的AI Agent产品Manus,刚被曝出背后公司一举裁掉国内七成团队。事实上,Manus总部已在5月搬到了新加坡,国内员工何去何从?现在答案终于落定,一言以蔽之:大刀阔斧地裁员。
你有没有想过,为什么 Cursor、v0、Perplexity、Lovable、Bold 这些服务数百万用户的顶级 AI agent 产品,竟然都有一个惊人的共同点?它们全部都不是基于任何 AI 框架构建的。
还记得那个号称「全球首个设计 Agent」的 Lovart 吗?它是继 Manus 后在海外爆火的另一款 Agent 产品,而且学到了 Manus 的「精髓」:有邀请码才能体验。当时国内出现了「一码难求」的盛况。最近,这个 Lovart 出了国内版,名叫星流 Agent,专注于设计和创意内容生成
最近,BetterYeah AI 宣布完成了国内 AI Agent 赛道目前公开的规模最大的融资。
最近一直在测试大模型来做生物信息,效果还可以,主要使用gemini cli,由于一直还有机会用上claude code,所以只能通过cursor来使用claude 4,这次内容我们来测试一下claud4的生物信息能力。
2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?