最新外国「自研」大模型,都是套壳国产?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
最新外国「自研」大模型,都是套壳国产?
7674点击    2025-11-01 13:08

外国开发者:我们该开始学习中文了吗?


绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文?


最新外国「自研」大模型,都是套壳国产?


本周,知名 AI 代码工具 Cursor 发布了 2.0 版重大更新,推出了首个自家的代码模型 Composer,以及用于并行协作多个智能体的新界面。


新模型一发布,大家在祝贺 Cursor 终于「扬眉吐气」、用上自家模型的同时,也发现这个大模型在思考的时候一直讲中文,而且行为和国产模型极其相似


Composer 是 Cursor 使用强化学习训练的一个大型 MoE 模型,能够出色地处理实际代码,并且速度非常快。


最新外国「自研」大模型,都是套壳国产?


内部基准测试中该模型在编码任务上达到行业前沿水准,生成速度比同类模型快四倍


最新外国「自研」大模型,都是套壳国产?


据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝滑。


不过在看到模型输出了这么多中文之后,人们纷纷开始猜测它背后的「基础」是哪家大模型,难道是 Qwen Code?


最新外国「自研」大模型,都是套壳国产?


无独有偶。


AI 编程独角兽 Cognition 近期也推出了他们最新 AI 模型 SWE-1.5。这是一款快速智能体模型,参数量达到了数千亿,在编码性能上接近 SOTA,并显著提升了速度 —— 比 Haiku 4.5 快 6 倍,比 Sonnet 4.5 快 13 倍。


最新外国「自研」大模型,都是套壳国产?


目前该模型已在他们的 IDE 平台 Windsurf 上开放使用。


最新外国「自研」大模型,都是套壳国产?


不过,模型发布出来之后很快就被人们仔细分析了一通,有网友认为 Cognition 的新模型背后也是基于中国的 AI 模型进行开发和改进的。


有人对 SWE 1.5 进行了大模型「越狱」,结果模型直接回答自己是智谱 AI 开发的 GLM 大模型。


最新外国「自研」大模型,都是套壳国产?


智谱的官推也来转推祝贺。


最新外国「自研」大模型,都是套壳国产?


业界大佬:证据指向中国开源模型


X 博主 @deedydas 认为,Cognition 的 SWE-1.5 是基于中国公司智谱的 GLM 4.6 模型进行定制(精调 / 强化学习),并运行在 Cerebras 的硬件上;Cursor 的 Composer 模型也带有中国式推理痕迹。


最新外国「自研」大模型,都是套壳国产?


最新消息,cerebras 发邮件官宣,11 月 5 日推出 zai-glm-4.6 作为新编码模型,这是给实锤了?


系统架构师 Daniel Jeffries 也发帖表示,有很多证据表明 WindSurf 和 Cursor 这些新模型都是经过微调,而不是从零开始训练的,这对于开源社区来说是一个胜利。


Jeffries 进一步指出,从头开始训练一个基础模型的成本极其高昂,许多资金和计算资源更雄厚的公司都未能成功。因此,WindSurf 和 Cursor 团队选择在后期训练阶段投资强化学习是非常合逻辑的,尤其是他们已经拥有强大的数据集和大量用户编码数据,这些数据更容易进行处理。


最新外国「自研」大模型,都是套壳国产?


他还认为,Cursor 和 WindSurf 的团队并没有足够的资金来建设一个庞大的训练集群,也没有足够的数据和团队支持从零开始建立一个大模型。在当前,许多大型实验室已经在这一领域建立了强大的规模,单靠独立开发是无法成功的。


最新外国「自研」大模型,都是套壳国产?


此外,他还指出,一些反对开源的公司和个人阻碍了开源模型的发展,影响了现代软件开发和创新的进程。他呼吁美国公司意识到开源的重要性,回归开源理念,而不是发布功能受限的专有模型。


最新外国「自研」大模型,都是套壳国产?


目前,Jeffries 发布的这篇帖子已被 LeCun 转发,进一步引发了讨论。


网友们纷纷表示,中国的开源基础模型已经具备了足够的能力来支持西方产品的开发,这意味着全球 AI 正进入多极化竞争的新格局。


最新外国「自研」大模型,都是套壳国产?


有网友幽默评论道:是不是该开始学中文了?


最新外国「自研」大模型,都是套壳国产?


国产开源模型,已成为 AI 领域主流


10 月 29 日,英伟达 CEO 黄仁勋在华盛顿的 GTC 大会上,除了发布新 GPU,也说了一番对目前 AI 行业现状的观察。他表示开源模型已变得非常强大,大大加速了 AI 应用的进程,开发者、研究者、全球的公司都需要开源。


在老黄展示的全球开源模型的下载及采用情况图中可以看到,2025 年以来,阿里的通义千问模型(Qwen)已占据开源模型的大部分市场份额,并且领先优势还在持续扩大中,衍生模型数量也是全球第一


最新外国「自研」大模型,都是套壳国产?


随着开源模型的推理能力、多模态能力、专业领域能力的提升,它们不仅仅在帮助开发者,甚至已成为初创公司的命脉。或许对于 Cursor 和 Cognition 来说就是这样。


除此之外,在 AI 社区 HuggingFace 的趋势榜上,排行前列的模型都出自国内公司,有 MiniMax、DeepSeek、Kimi、百度、混元、千问,还有美团的 LongCat。


最新外国「自研」大模型,都是套壳国产?


在第三方的基准平台 ArtificialAnalysis 上比较和分析模型质量、性能、推理速度、上下文窗口、参数数量和许可详情等性能指标,排行前列的也大多数是国产模型


最新外国「自研」大模型,都是套壳国产?


看起来不论是在模型技术水平与能力,还是全球开发者、科技公司的接受度上,国内开源大模型都已经确立了领先的地位,正在改变着全球 AI 领域的竞争格局。


这场大模型技术竞赛中,追赶者和领先者的身位,正在慢慢发生变化。




文章来自于微信公众号 “机器之心”,作者 “机器之心”

关键词: AI新闻 , 套壳 , Composer , Cursor
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner