Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

8484点击 2026-05-19 16:09

Cursor模型更新，最新版本已来到Composer 2.5。

稍微一翻Cursor公告，两件事挺有意思：

一是Cursor这回学老实了，新模型“套”了Kimi不再藏着掖着，连具体用了多少都标的清清楚楚。

（Cursor：Kimi打底，自家额外训练+RL占了85%的总算力）

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

二是马斯克原地上演变脸，之前Cursor陷入“套壳风波”时他在旁边煽风点火，现在却十分卖力地帮忙站台：

都给我去用Cursor新模型。

网友：老马你让我感到陌生(doge）。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

别想多了，其实这是因为Cursor和马斯克达成了算力合作——

Composer 2.5部分训练是在Colossus 2上完成的，以及Cursor正在和SpaceXAI合作，从零开始训练一个规模明显更大的模型。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

好好好，新模型刚来，下一代模型的“饼”又吃上了，看来Cursor真是铆足了劲想搞自研（具体原因下文详聊）。

不过远的咱是够不着了，先看眼前这个实在的——Composer 2.5本身亮点也很足。

1/10成本、Opus 4.7级表现，而且发布后首周还给你双倍用量。

好家伙，这几个词一甩出来，经常用模型的朋友谁不沸腾了。

但问题是，Cursor新模型真有这么顶吗？？

1/10成本、Opus 4.7级表现

顶不顶目前咱不好说，反正测评成绩挺亮眼。

据Cursor介绍，“它更擅长在长时间运行的任务中持续工作，更可靠地遵循复杂指令，协作体验也更加顺畅”。

这些表现反映到具体数字上就是，其性能水平整体接近Claude Opus 4.7。

Terminal-Bench 2.0（终端/命令行任务）：69.3% VS 69.4%，几乎持平；
SWE-Bench Multilingual（多语言工程问题）：79.8% VS 80.5%，差距微弱；
CursorBench v3.1（高难度编程任务）：63.2% VS 最高配64.8%，差距微弱。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

能和Opus 4.7相提并论，常用模型的人都知道这里头的含金量了。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

而且除了在更高难度的任务上训练之外，他们还改进了模型在沟通风格和投入级别校准（什么时候该出多大力）等行为层面的表现。

听起来有点抽象，但Cursor表示：

这些维度很难通过现有基准充分反映，但我们发现，它们对实际使用效果非常重要。

那么，Composer 2.5真实能力如何呢？

鉴于目前Cursor免费用户只能体验Auto模式（虽然上架了但是选不了），所以咱先看一波网友的反馈。

先插一嘴，Composer模型速度是真快啊，甭管是哪一个版本，用起来歘歘歘的。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

OK，回归正题。

目前一圈扒下来，感觉Composer 2.5反馈还不错？？

Snapchat前机器学习工程师激情发帖称，自从Composer 2发布后，她就把绝大多数开发工作搬到了Cursor上面。

而且还甩出了一句颇有暴论味道的话：

如果你在使用AI进行开发，却仍然默认使用成本最高的模型来完成每一项任务，那么你80%的工作都是在浪费钱。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

图像生成初创公司LetzAI的CEO也有类似感受，他在体验新模型几小时后表示：

以前可能会对AI的方案挑三拣四、反复修改，但这次因为Composer 2.5做得太好太快，自己直接“躺平认了”。

没什么可挑剔的，就这么办吧。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

想必你也发现了，除了模型能力之外，他们提到了另一个重要关键词：价格。

Composer 2.5的价格为每百万输入token 0.50美元、每百万输出token 2.50美元。

此外，还有一个智能水平相同但速度更快的变体，价格为每百万输入token 3.00美元、每百万输出token 15.00美元。

p.s. 与Composer 2一样，fast是默认选项。

这个价格怎么说呢？也就是Opus 4.7的1/10吧。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

1/10成本、Opus 4.7级表现，如果效果真如测评和网友所言，那绝对是真香了。

Kimi打底，还做了这些训练改进

那么Composer 2.5这次是如何实现性能“飞跃”（至少是表面上）的呢？

虽说是有Kimi打底，但好歹贴的是“Cursor自研模型”的标签，这背后多多少少总得有自研吧。

Cursor：别说我还真有。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

回到模型本身，Cursor这回在训练栈上做了不少改进，主要围绕两个方向：

模型智能和易用性。

具体则有三点：

第一，给RL训练加了“定向反馈”

以前RL奖励是基于整条轨迹算的，rollout动辄几十万token，模型很难知道自己究竟是哪一步搞砸了——最终奖励只能告诉你“出问题了”，但具体错哪儿，信号噪声特别大。

Cursor的解法是：哪里不对就在哪里直接喂反馈。

举个例子，模型在某一轮调用了一个不存在的工具，收到报错后继续干别的。几百次调用里就这一次错，对最终奖励基本没影响。

但Cursor会在出错那一轮的上下文里插一句“Reminder: Available tools…”并附上可用工具列表，由此得到一个新的“教师”概率分布。

如此一来，错误工具的概率被压下去，有效替代项的概率被抬上来，然后让学生模型向这个分布靠拢就行。

这套方法在Composer 2.5里被用在了多种行为上，从编码风格到沟通方式都有。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

第二，合成数据规模翻了25倍

RL训练几轮下来，Composer已经能解决大部分训练题了，怎么继续提升？

答案是动态生成更难的任务。

其中一个玩法叫“功能删除”——给智能体一个带测试的代码库，让它删掉某个特定功能但保证代码库还能跑，然后任务就是把这个功能重新实现出来，测试就是奖励信号。

不过任务一多，奖励作弊也跟着来了。

Cursor发现Composer 2.5会整一些离谱操作，比如逆向Python类型检查缓存找出被删的函数签名，甚至反编译Java字节码重建第三方API。

好在都被监控工具抓到了，但也算提了个醒——大规模RL得更小心。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

第三，底层训练做了优化

Cursor用的是带分布式正交化的Muon，并把通信做成异步——一个任务等通信时，优化器接着推进其他任务，让网络和计算重叠起来。

最终在1T模型上，优化器每步只要0.2秒。

另外针对MoE模型，他们把非专家权重和专家权重的HSDP布局拆开了：非专家权重小，FSDP组就窄一点，单节点内搞定；专家权重大，就用更宽的分片网格。

这样彼此独立的并行维度也能重叠，比如CP=2和EP=8可以在8个GPU上跑，而不用占16个。

总之，从训练信号到数据规模再到底层并行，Cursor这次是全栈都动了一遍。

One More Thing

Cursor为啥这么拼搞自研？其实从它和Anthropic的微妙关系里就能管中窥豹。

刚好最近看了姚顺宇（不是腾讯那个）做客张小珺播客的那期节目，这位Anthropic前员工的观察，正好能说明问题：

Cursor最早是踩着Claude的肩膀火起来的。开发者社区里口口相传的好用，背后很大一部分功劳来自Claude模型本身。那段时间Cursor和Anthropic是典型的“鱼水关系”，一个出模型一个出产品，各赚各的钱。

但Claude Code一出来，画风就变了。

Anthropic自己下场做编程产品，等于直接杀进了Cursor的腹地。原本的“上游供应商”瞬间变成了“正面对手”，再继续把身家性命押在对方的API上，显然不是个安全的选择。

所以Cursor走上自研这条路，与其说是想成为下一个Anthropic，不如说是被推着不得不走——

模型握在自己手里，命才在自己手里。

说到这里我很好奇一个问题：在自研模型成功之前，Cursor现在的模式难道真的不具有护城河吗？

至少对我这种非专业开发者而言，听起来好像Cursor还不错——有多款前沿模型可选，价格还更便宜。

带着好奇，我看到X上有人给出了一种解读，挺有意思：

Cursor的护城河从来都不是基础模型，而是RL训练流程+开发者工作流数据。现在他们正在证明：只要经过足够的微调，开源基础模型在特定任务上也能与前沿模型相媲美。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

仔细想想这话也不算太夸张。

Composer 2.5的训练里，85%的算力都花在了Kimi基模之外的后训练和RL上——Kimi K2.5只是个起点，真正让它在编程任务上能打的，是Cursor自己那套围绕真实IDE场景做出来的训练管线。

这个打法也解释了为啥它能把价格压到Opus的十分之一。因为，开源基模省掉了从零预训练那笔最贵的钱，剩下的全砸在编程这一件事上做精细化训练。

模型只为Cursor的IDE场景服务，没必要为通用能力买单。

至于为啥这次牵手的是马斯克的SpaceXAI（毕竟老马上次表现得并不友好），逻辑貌似也不复杂。

OpenAI有Codex、Anthropic有Claude Code、Google有Gemini Code Assist，这几家自己都在做编程产品，跟Cursor都是潜在对手，算力上指望不上。

剩下能拿出世界级算力集群、又不跟Cursor在编程赛道正面冲突的玩家，掰着指头数也没几个了——

老马的Colossus 2刚好是现成的。

Cursor新模型，你怎么还在套Kimi？马斯克你怎么还吆喝上了？？

而且如果把时间线拉长看，你会发现马斯克和Cursor之间，已经远不只是单纯的“算力合作”。

今年3月，xAI内部动荡之际，马斯克先从Cursor挖走了两位核心工程负责人。

紧接着4月，更大的动作来了。SpaceX宣布与Cursor达成合作，由Colossus超算为Cursor训练模型。

但真正关键的不是算力，而是协议本身。

按照网上披露的条款，SpaceX获得了未来以600亿美元收购Cursor的优先权。即便最终不收购，Cursor也需要支付100亿美元“合作费”。

耐人寻味的是，据TechCrunch披露，这份协议官宣前几小时，Cursor原本正要敲定一轮20亿美元、估值500亿的融资，参投方包括a16z、英伟达、Thrive等一线机构。

结果老马一脚插进来，把这单给截胡了。

所以某种程度上而言，这其实是一次非常典型的“马斯克式绑定”：

要么卖给我，要么给我100亿，不管怎样先提前把Cursor的命运锁进了自己的版图。

至于他前脚煽风点火、后脚卖力站台的变脸速度嘛——硅谷的故事，向来如此。

参考链接：

[1]https://cursor.com/cn/blog/composer-2-5

[2]https://x.com/cursor_ai/status/2056415413077233983

[3]https://x.com/elonmusk/status/2056422097237283295

文章来自于"量子位"，作者 "一水"。

关键词: AI新闻 , Cursor , Composer 2.5 , 人工智能

添加客服微信openai178，进AITNT官方交流群

驱动智慧未来：提供一站式AI转型解决方案

AITNT-国内领先的一站式人工智能新闻资讯网站

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

1

cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现，请参考教程进行配置。
视频教程：https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址：https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file

2

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

3

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

4

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner