
AI修Bug新SOTA:SWE-Bench Lite60.33%修复率,像人一样能积累经验,中科院软件所出品
AI修Bug新SOTA:SWE-Bench Lite60.33%修复率,像人一样能积累经验,中科院软件所出品AI学会像人一样修Bug了!“这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……
AI学会像人一样修Bug了!“这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……
在人工智能技术浪潮的席卷下,AI在编程领域的应用正以令人目眩的速度演进,深刻改变着软件开发行业的固有格局。
自 2021 年夏季 GitHub Copilot 以预览版问世 以来,编程助手产品呈现爆发式增长。这类工具最初被用作增强型代码补全工具,而 Cursor、Windsurf 等产品则迅速转向了 Agent 交互模式:通过自然语言指令触发,助手能自主执行修改代码文件、运行终端命令等操作。
你有没有发现,AI 应用生成平台们正在走向一条与大家预期完全不同的路?很多人原本以为这会是一场血腥的零和游戏,大家会在价格战中厮杀到底,最终只剩一家独大。但现实却让人意外:这些平台不但没有互相厮杀,反而开始各自寻找差异化的定位,在不同的细分市场中共存共荣。这让我想起了大语言模型市场的发展轨迹,同样出人意料,同样充满启发。
你会掏钱吗?你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。
还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。此外在Agent任务和推理方面进一步升级。但加量不加价,定价和Claude Opus 4一样。
还在为复杂的 AI 编程工具定价而头疼吗?想象一下,你每月为 Cursor 付费 20 美元,却在输入三个提示后就遭遇速率限制,或者突然发现"无限使用"的套餐增加了额外费用。这不是个例,而是整个 AI 编程工具行业面临的系统性问题。就在开发者们抱怨这些"阴暗"和"模糊"的定价策略时,一家名为 Cline 的开源 AI 编程公司却逆势而上,刚刚完成了 3200 万美元的种子轮和 A 轮融资。
企业软件开发商 Linear 本周宣布完成 8200 万美元 C 轮融资,本轮由 Accel 领投。该公司产品与 Atlassian 旗下多款产品存在竞争关系。
Anthropic突然撤销了OpenAI员工对Claude的访问权,声称该公司违反了其服务条款。
2025 年 AI 产品井喷,浪潮夹杂着泡沫,到底什么产品能穿越周期? WAIC 世界人工智能大会已经结束,APPSO 系列专题继续,我们希望梳理这半年来重要的 AI 产品和趋势,并在现场挖掘有用有趣的产品,同时探讨产品背后的一些细节