正面硬刚Claude Opus 4.6:我们给GLM-5.1使了三个“绊子”,它居然…
正面硬刚Claude Opus 4.6:我们给GLM-5.1使了三个“绊子”,它居然…今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
刚刚,深圳机器人芯片公司地瓜机器人宣布拿下1.5亿美元(约合人民币10.24亿元)B2轮新融资,某零售科技与供应链巨头、滴滴、Prosperity7风投基金、高瓴创投、淡马锡旗下Vertex Growth、五源资本等产业巨头及一线资本参投。
AI圈的节奏已经快到让人产生幻觉了。
Claude Code 负责人 Boris Cherny 最近可能很头疼,因为这款神级 AI 在快速更新的同时被曝出各种问题。
那个给GPT-4o注入灵魂的人,走了。
今天早上,Cursor 在X上发布一条推文:“我们重建了 MoE 模型在 Blackwell GPU 上生成 Tokens 的方式,导致推理速度快了 1.84 倍。”
LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。
和之前 Claude Code 泄漏的代码揭示的一样,Claude Mythos 它真的来了。今天凌晨,Anthropic 发布了大量关于其新模型 Claude Mythos Preview 的信息(包含一份长达 244 页的系统卡)。同时,Anthropic 还宣布了一个基于此模型的 AI 网络安全项目 Project Glasswing。
从设计师到创业者。
今天在榜单上看到一个项目: