AI资讯新闻榜单内容搜索-Odin

不止修bug：Agentic Coding评测走向复杂feature交付新阶段

在 Princeton 发布 SWE-Bench 之后，用真实世界代码仓库+可执行测试评测大模型软件工程能力，几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展，也催生了一系列 SWE 系列 benchmark，在刻画模型 bug 修复能力方面发挥了重要作用。

来自主题: AI技术研报

7810 点击 2026-03-04 13:44

重磅！阿里云Coding Plan全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5

刚刚，阿里云Coding Plan订阅服务全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型。用户订阅套餐后，可在Qwen Code、Claude Code、Cline、OpenClaw等AI工具上自由切换使用这些模型，享受更稳定、Tokens额度更高的模型服务。

来自主题: AI资讯

8913 点击 2026-02-27 11:18

Karpathy：AI编程已质变，就从去年12月开始

2025年12月以前的AI编程，跟12月以后的AI编程完全是两码事了。这一最新判断，来自Vibe Coding的提出者Karpathy。作为最积极拥抱AI Coding的程序员代表人物之一，Karpathy甚至坦承：在去年12月之前，Coding Agent虽说也有亮眼表现，但实际上“基本没啥用”。

来自主题: AI资讯

8527 点击 2026-02-27 11:08

Claude Code更新，你终于可以随时随地在手机上Vibe Coding了。

有一说一，Anthropic这家公司虽然贱不喽嗖的，但是做产品，是真的好。。。昨天凌晨，Claude Code终于上了我梦寐以求的一个功能。remote control。远程控制。

来自主题: AI资讯

9441 点击 2026-02-26 12:52

Vibe Coding，是怎么「玩废」程序员的？

「自然语言就是新的编程语言。」这句话在过去一年里被无数人奉为圭臬。特斯拉前 AI 总监 Andrej Karpathy 带火的「Vibe Coding」（氛围编程）更是让这种狂热达到了顶峰——你不需要懂语法，不需要管实现，只要对着 AI 喊出需求，然后 Check 一下感觉（Vibe）对不对就行了。

来自主题: AI资讯

9817 点击 2026-02-23 18:42