AI四小强重新上桌了？

8786点击 2025-07-28 09:15

AI四小强重新上桌了？

当7月16日身着唐装的黄仁勋在公开演讲中，将MiniMax与“DeepSeek、阿里巴巴、百度”一同提及，并称“开发的产品都是世界级”时，沉寂半年之久的AI四小强，颇似甄嬛回宫，手里拿上了逆袭剧本。

实际上，进入7月，扎堆推出Deep Research的AI四小强，正跃跃欲试重新登上牌桌。

近期，阶跃星辰的阶跃AI Deep Research正式开启邀请测试，此前6月，MiniMax连续5天上新了推理模型M1、视频生成模型、Agent等，其中MiniMax-M1集成了包括Deep Research（深度研究）在内的技能，同在6月，月之暗面的Kimi Research跟上。而早在3月底，智谱发布了AutoGLM沉思版，作为智能体(AI Agent)也融合了Deep Research能力。

截止发稿前，AI四小强已全抢上这一波Deep Research的船票，并在7月争先恐后在模型层上新，前半年低调发育的AI四小强，在大厂夹击下正迅速追上。

“现在大模型进入了深水区，单靠模型参数或者Demo已经没办法说服市场了，”某头部创投机构联创林晟（化名）告诉字母榜，对商业化压力越来越大的AI四小强而言，在垂直领域做深，做更能交付价值的Deep Research以及Agent，都是在大厂围剿中较为安全的生态位。

AI四小强也“需要通过跟上Deep Research这样关键的技术迭代向投资人证明，他能在大模型下半场占有一席之地。”林晟补充道。

同时，对AI四小强来说，跟进Deep Research，押注可以自主规划任务并交付结果的AI Agent，不仅是为重上牌桌，也是要搏一个“钱景”。

据外媒报道，为了使用OpenAI面向ChatGPT Pro用户推出的Agent “Deep Resaerch”，约20%的用户升级成了每月订阅费高达200美元的Pro会员。同时，恒业资本管理合伙人江一告诉字母榜，随着DeepSeek的爆火，他们慧辰股份推出的消费Agent，原本在AI方面没有投入预算的客户，已经将原本信息化的预算挪向AI，而这些应用Agent的订单往往都在数百万级别。

这一次，AI四小强能重新上桌吗？

一

在2025年的AI Agent热潮里，Deep Resaerch（深度研究）类的产品是最早落地的一批。

从去年底谷歌发布首个Deep Resaerch开始，数月内，OpenAI、Anthropic等迅速跟进，能做PPT、写财报分析、进行学术研究的Deep Resaerch成了新的技术标杆，也让AI Agent在用AI 辅助人的道路上向前迈了一步。

如今AI四小强都推出了自家的Deep Research，正面硬刚字节、腾讯等大厂。

不过需要注意的是，Agent作为四小强关键的技术展示窗口，杨植麟们的表现颇为谨慎。都以内测版开路，通过一个月的小范围内测，去收集专业用户的反馈意见，在调试后才全量上线。

这种谨慎开大的做法也显露出AI四小强对这次亮相的重视。

此外，在Deep Resaerch的路径选择上，AI四小强也分裂出了两种路径。

一条路径崇尚傻瓜式操作，门槛更低，以月之暗面的Kimi-Researcher为代表，摸着OpenAI、Gemini过河。正如OpenAI demo所演示的一般，用户只需发出指令，合上电脑等待，就能得到一份达到研究分析师水准的报告。和月之暗面选择同样路径的，还有字节。

这种路径选择让AI自主思考和理解，推理和调用工具来解决问题，极大降低了用户的使用门槛。“用户不需要准备复杂的提示词，只需要等待，甚至为了没有耐心的大部分用户，OpenAI官方宣称任务交付时长在1～30分钟，测试下来Kimi-Researcher一般都会在10～20内生成结果。”在某国企AI相关部门就职的宋城（化名）告诉字母榜。

另一种则是高用户互动型，结果很可控，包括智谱、Minimax，选择了类Manus的工作流（Workflow）模式。

此外，Kimi还会提供一份可视化的报告，提供卡片、表格、思维导图等多种信息，目前ChatGPT 尚未提供类似的功能。

在这种模式下，用户需要准备复杂的提示词，提示词的复杂程度决定了生成效果，而且在Agent工作过程中，随着持续调用工具，用户需要加入提供反馈，宋城表示，这种模式AI的动作轨迹都一早设计好，可控性更高，只是用户被绑在了任务上，“如果一个任务需要跑1～2个小时，为了及时给AI做确认、纠偏，需要时刻注意页面。”

但最终两种路线的分歧，实际上都指向了一个核心问题，即无论走哪一条路，当下大模型的能力还不足以支持更智能的Agent的推出。对用户来说，每次任务执行都有开盲盒的错觉，因此AI四小强也在补足自身的模型能力。

无论是Mini Max推出的M1新模型，上下文的长度达到一兆，还是月之暗面的K2模型，总参数量达到一万亿，就在7月25日，阶跃星辰场发布了Step 3大模型。针对国产卡32K上下文，这代模型推理效率最高可达到deepseek R1的300%。

二

事实上，从AI六小龙到AI四小强，杨植麟们的2025年过得颇为艰难。

随着年初Deepseek带起推理模型的新潮流，原本佛系观战的腾讯携元宝强势下场，阿里也用夸克浏览器争夺新流量入口，字节的豆包短暂从下载榜滑落，但凭借频繁的迭代上新持续探入垂直场景。

“在年初我们（Kimi）停止投流之后，国内不少应用商店搜索 kimi 甚至第一页都看不见，在苹果 App Store 搜 kimi 会推荐豆包，在某度搜 kimi 会推荐某度 DeepSeek-R1 满血版。”

Kimi发布K2 大模型后，Kimi 的技术员公开表示，即便面对如此艰难的情况，Kimi 也没有恢复投流。

去年在大模型赛道上激进砸钱推流的AI六小龙，一时之间陷入了对自身技术实力的自证漩涡。这似乎也让杨植麟们意识到，技术实力似乎远比用户规模，更能决定大模型创企的发展。

半年内，AI四小强悄悄调整重心，在生存压力下，放弃对用户规模的追逐成了第一步。

从去年12月至今，一批负责应用和商业化的六小龙高管相继离开。其中包括但不限于前智谱COO张帆、前MiniMax商业化负责人魏伟、前月之暗面核心产品负责人明超平、前阶跃星辰“冒泡鸭”产品负责人张心皓（尚未离职，转为内部顾问）等等。月之暗面也传出了调整投放策略的消息。

从Deepseek的推理模型，海外科技大厂如Claude、XAI等在Deep Resaerch上的新突破，到Manus的Agent热，大模型的竞争热词短短数月换了几轮。被DeepSeek冲击估值体系的AI四小强，不得不重新将技术迭代确立为公司的最高优先级。

而在这场AI时代的“注意力资源”比拼之战中，重新跟上节奏的AI四小强，需要向外界证明自己有重上牌桌的实力和可能性。Agent成了最好的发力点。

“过去国内大模型都在对标OpenAI、复制OpenAI，现在在Agent这样的应用层，要打差异化了。”江一告诉字母榜，AI头部创企正试图在垂直技术的长板上去做突破，避免与大厂的同质化竞争。

Kim7月推出万亿参数的 K2模型，为智能体任务（agentic tasks）做了专门优化，被Hugging Face、Perplexity CEO 发文称赞。多模态则是MiniMax的舒适区，近期发布的视频模型Hailuo 02在Artificial Analysis Video Arena评测榜上排名第二，仅次于字节的Seedance 1.0。

可以看到，跑在前面的已经拿到了来自资本市场的好消息。

智谱频频传出融资消息，又成为首个正式开启上市辅导备案的AI大模型创企，MiniMax爆出即将完成近3亿美元（约合人民币22亿元）新融资，并向港交所提交IPO申请，目标“今年内上市”，估值从25亿美元冲到40亿～50亿美元之间。

押注Agent，AI四小强已经跟上来了。

三

不过，在Agent时代，跟上节奏的AI四小强还需再次证明自己的价值。

技术卡位战是杨植麟们首先要自证的第一道坎。尽管月之暗面6月发布的 Kimi-Researcher ，声称在“人类最后一场考试”(Humanity's Last Exam) 中，取得了 26.9% 的 Pass@1 成绩，创下最新的 SOTA 水平。但可以看到，相比起引发热议的Manus、Lovert，前者拿到硅谷知名风投Benchmark领投的7500万美元融资，亮相3个月完成文生图、视频生成功能的迅速迭代；后者顶着全球首个设计Agent的名头得到了马斯克的激情点赞。

更为出圈的Manus、Lovert，调用的都并非国内的大模型。对杨植麟们而言，拿出自研Agent只是第一步。他们需要用更出圈的应用案例，证明自身技术的优越性。

“Agent需要给客户创造愿意付费并且可量化的价值。”

江一告诉字母榜，在Agent创企们拿着锤子找钉子的过程中，出圈的应用案例要给客户提供真金白银的可量化价值，而这往往并非用ChatBot这类基础功能可以达到的。他们为一位大客户交付了Agent矩阵，涉及到从门店销售、找高潜门店售点铺货，到定市场策略、协同物流等多个流程。

其中，客户有20万地推销售，工资高，流动性更达到60%～70%，培训成本占到了营收的12%。通过培训销售使用Agent，客户将原本销售30天的入职培训时间缩短到了两天，新人用agent也能达到中等偏上的销售水平。

对AI四小强来说，找到目标客户后如何创造远大于售卖价格的交付价值，用出圈的应用案例证明自己，是必然要闯的第一关。

但在Agent大爆发的2025年，杨植麟们也缺“钱多、有耐心”的好客户。

尽管算力价格被大厂联手打进“厘时代”，但不同于单纯对话的有限的算力消耗，需调用多个大模型、访问多个网址的Agent，每个任务的Token消耗量都不低。“生成一份还可用的调研报告，要22万token，用cursor（智能编程）一个来回就消耗300万token”，在某国企就职的宋城告诉字母榜，对企业来说，使用Agent的成本并不算低。

同时，技术的迅速迭代也让Agent的使用成本节节攀高。“Manus发布前核算完成单次任务的成本在2～3美元，几轮优化后原本成本已经降低，但迭代添加视频生成能力等等，成本又再次拉了上去，”前Manus员工方成（化名）告诉字母榜。

而使用成本的高昂、单次任务执行动辄要半小时、甚至一小时完成任务，就连OpenAI也在“祈求”用户的耐心。

在OpenAI面向ChatGPT Pro用户推出的Agent “Deep Resaerch”后，其团队核心成员Issa Fulford接受采访时就表示“（OpenAI Deep Resaerch）的目标用户是专业消费者（prosumer），那些愿意为了一个详细报告等待 30 分钟的人。”

根据SimilarWeb的监测数据显示，2025年以来，Manus的月访问量从3月的2376万次，跌到了6月的1730万次；Genspark的月访问量从4月的888万次，下降到了6月的769次。头部Agent 的增长颓势也告诉我们，Agent距离跑通PMF（产品市场匹配度）还有一段路要走。

无论如何，可以肯定的是，AI四小强，必须开始赚钱了。

本文来自微信公众号：字母榜，作者：马舒叶

关键词: AI新闻 , MiniMax , 月之暗面 , 人工智能 , AI四小强

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现，请参考教程进行配置。
视频教程：https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址：https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0