这几天,「打工人版」Claude火得一塌糊涂。
一键清空桌面、杂乱笔记瞬间成报告,甚至,给AI一个文件夹,就能直接帮你干活。

毫不夸张地说,你的父母都能用上「编码版」Claude了!还有人惊呼,「这就是第二个ChatGPT时刻」。


更令人惊掉下巴的是,Claude之父自曝,Claude纯100%编码,一周半就创造出了Cowork,端到端真正实现了闭环。

不仅如此,最近爆红的各种Claude Skills库,直接给AI加上了双重buff,「技能包」让AI智能体干活更得心应手。
有的Skills GitHub库,直接刷爆近40k星标。

一夜之间,AI智能体竟变得这么强了?
硅谷AI能造APP,却卡在最后一公里
人们常说2025年是「智能体元年」,但要真正规模化普及,还得看2026年。
CES 2026大会上,老黄再一次对当前AI的进展,做出了前瞻性的判断——
智能体本身,就是未来的交互界面。


无独有偶,OpenAI总裁Greg Brockman也给出了惊人一致的判断:2026年,将是企业级智能体真正普及的一年。

回望过去一年,我们看着OpenAI Operator在浏览器里熟练地帮人订机票;看着Grok 4并行多个智能体,暴力破解了人类最高难度的纯文本考试;看着Claude Code让不懂代码的普通人,在几小时内手搓出一个App。

Claude之父Boris Cherny半开玩笑地说,他过去三十天的代码贡献,100%都是由Claude Code完成
一切看起来都很美好。AI似乎已经无所不能,它能写诗、能画画、能写代码。
但是,且慢。
如果你把视角从硅谷的演示Demo,拉回到真实且残酷的商业世界,你会发现一个尴尬的「最后一公里」断层:
这些聪明的AI,敢不敢让它去审核几亿金额的标书?敢不敢让它在没有人类盯着的情况下,对涉及法律责任的流程做判断?
绝大多数时候,答案是沉默。
因为写错代码可以Debug,画错图可以重绘,但在商业核心业务——
尤其是招标采购这种合规要求高、风险集中的领域,错误的代价往往是巨额罚款、法律诉讼,甚至是牢狱之灾。
这才是AI落地的真正深水区。
地狱级副本:招标采购领域的AI转型
如果不是央国企或大型集团的供应链负责人,你很难想象这个岗位的「酸爽」。这绝不仅仅是填几张表那么简单。
招标采购,是连接企业供应链上下游的超级枢纽。在这个枢纽里,充满了著名的「不可能三角」:合规、成本、效率。
首先合规问题,招标文件隐性风险审查、评审环节主观判断,都存在一定的人为干预,影响了公平公正。
还有成本极难控制,流程中人工加班、重复工作是显性成本,供应商选择不当,更成为了难以回避的隐性成本。
从效率来说,从招标文件编制、审核、再到评审环节专家评审,都需要消耗大量的人工精力。
这三大挑战,依靠传统的人工模式,已经难以跟上企业的发展需求。

在投标环节,往往会出现各种异常行为。
以市政EPC项目为例,专家需在短时间内,对几百份文件进行风险排查,标书动辄上千页。
传统的方式比如文档识别,很难深层次检测投标文件内容本身异常,比如文本语义级相似、图片实质性相似、关键要素相似、报价规律性等。
因此,这些过程皆需要专家逐字逐句进行比对,工作量巨大。
科大讯飞数字化业务群CTO张永亮举了一个真实的场景案例:
业务方提出如下一个采购需求,到了编制环节,编制人员可能因为对条款不熟悉、项目不了解,导致效率低,甚至可能出现很多漏洞。
再到下一个环节中,审核人员又需要耗费大量精力查找隐性条款,若因查得不仔细,还会导致流标、供应商投诉等问题。
从管理者角度来说,历史招标过程中沉淀的优质经验,难以得到复用。
在传统模式下,不同专家的评分偏差率高,甚至一些项目因评分争议需要复核。
传统的电子化招采系统(如SRM系统),本质上只是把纸质流程搬到了线上。它们能解决流程流转的问题,但解决不了「决策」的问题。
与之相对的,现代大模型可以比对几百份标书的资质、筛查风险、判断价格合理性,但它们普遍存在的「幻觉」问题,对要求100%合规的招采行业来说堪称是「史诗级灾难」。
因此,行业真正等待的,并不是一个更聪明的AI,而是一套能够嵌入主流程、边界清晰、结果可核查的智能系统。
一座「智能体工厂」
回顾招采技术的发展,我们经历了从小模型专精(如OCR自动评标)的1.0时代,到大模型泛化认知的2.0时代。
而现在,随着全流程自主规划能力的出现,行业终于迈入了「智能体(Agent)」的3.0时代。
1月13日,「AI国家队」科大讯飞重磅发布的「招采智能体平台」,给出了一个完全不同的解题思路。
它彻底抛弃了「辅助工具」的定位,直接提出了一个大胆的概念:智能体工厂(Agent Factory)。
这意味着,讯飞把招采领域几十年积累的专业能力,全部拆解成了标准的「智能乐高模块」。
由此一来,以上三个痛点迎刃而解。

像搭积木一样,搭建智能体
作为招采行业的探路者,科大讯飞认识到:招采比他们想象的更加复杂。本质上是因为,缺乏承上启下的载体。
而这个全新的招采智能体平台,以Agent作为底座,打造了一个专属于行业的智能体平台。
它融合了行业知识库,利用Workflow构建了全场景的招采智能体应用。

这样,就能通过搭积木的方式,降低开发门槛,实现应用的快速落地。
而且,这个平台还有40多个场景的子Agent,比如招标文件解析,资质验真。
同时,平台还整合了11万多个泛行业的优质智能体,覆盖生活、学习、办公全场景。

要知道,速度就是企业AI落地的核心需求。
而这个平台,可以让你零代码、用自然语言描述需求,快速生成应用。另外,低代码工作流可以把各种能力、插件、组件、工具拼接起来。

现场怎样搭一个智能体
在大会现场,科大讯飞的工作人员为我们演示了如何像搭积木一样,搭建一个评审办法解析智能体。
其中,子Agent、知识库等,都是在招采智能体中上线的原子能力Agent。
具体步骤如下:首先,在开始节点配置输入,导入招标文件。
接着,招标文件解析Agent,可以利用多模态识别能力将招标文件内容解析为结构化信息。
然后,通过评审办法抽取一个Agent。接着在知识库节点,选择适配的大模型。
而初步评审办法解读Agent和详细评审办法解读Agent,会依次工作。
再后面的招标规则整合Agent,就可以实现对评审办法的全维度梳理,然后进行结构化的输出。
就这样,短短几分钟的时间,这个平台就搭建出一个Agent。

接下来,工作人员还具体演示了,怎样用它调试一个真实的项目。
导入一份招标文件,输入提示词,短短几秒就得到了具体的评审因素、打分因素、评分标准的关键等。

RPA赋能智能体

在招采过程中,有很多重复性很强的工作。比如在评标环节,专家经常需要第三方的网站,用到它们的知识,极其繁琐。
而且,资质条款的核验需要在企业内部查询,还需要手动核对,耗时又费力。
而科大讯飞的资质验真Agent,可以自主决策核验路径。全程都无需人工介入,能真正解放人力,提升效率。
这就是Agent x RPA比起传统RPA的优势。而现在,完全可以让Agent成为RPA的大脑。
工作人员演示了,资质验真Agent是怎样运行的。
首先,上传一份投标文件,输入评审条款。
然后Agent就识别出,需要到信用中国去实现验证。

接下来,RPA就代替了人手、人眼,完成了验证工作。全程它都在自主操作。

最后,它识别到了匹配度最高的一家公司。并且验证出该投标人并未被列入失信被执行人名单。
总之,如果说Agent是大脑,RPA就是它的双手,可以轻松打通上下游系统。

另外,辅助评标这个复杂的流程也放到智能体平台上了,企业可以快速增加节点,上传知识,完成企业自己的评标智能体开发。

实践证明,科大讯飞招采智能体平台在实际落地时AI与专家的主观项排名一致率已达到95%。
从成熟的智能体生态,到零门槛的快速搭建,RPA的高效协同,再到简洁的调试和模型精调,整个智能体平台,将为招采行业开启应用开发的新范式!
四个「反直觉」判断
如果说产品功能只是表象,那么透过此次发布会,我们可以提炼出四个触及AI B端落地灵魂的「反直觉」行业判断。
判断一:Agent必须从「聊天助手」进化为「可信赖的业务执行单元」
在消费级场景,AI的答复可以天马行空。
但在招采这类严谨的商业领域,AI输出的任何结果都必须建立在三个基石之上:可执行、可核查、可追溯。
这要求AI不再是一个仅能对话的「参谋」,而必须成为一个深度理解业务规则、能够自主完成复杂任务链且过程全透明的「专业执行者」。
讯飞通过构建40多个专业子Agent的能力矩阵,并实现其间的规划与协同,为AI配备了精准的招采「操作指南」,确保其操作稳定、规范,从而真正胜任关键业务环节。
判断二:高自由度是风险,约束才是核心竞争力
通常我们认为AI越自由、越有创造力越好。
但在招采这种规则系统里,Agent必须放弃「自由发挥」 。
此时,真正的工程能力,在于如何把Agent拆解进流程,用规则去校验它,用多重逻辑去约束它。
用一句话总结就是:
智能招采不是在展示模型有多聪明,而是在验证工程约束能力有多强。
对此,讯飞采用了SuperAgent架构,通过主Agent调度10+个子Agent,并接入招采法律法规库和行业知识库进行严格约束。
判断三:「长期活着」比「一次跑通」重要一万倍
做一次完美的演示很容易,但在真实环境中活下来很难。
招采的规则会变,流程会变,异常情况才是常态。
真正的技术门槛在于:当规则变更时,系统是否依然可用?在没有人工兜底的极端情况下,系统是否依然稳定?
因此,Agent能否进入主流程,取决于它的「生存能力」,也就是系统的鲁棒性。
如今,科大讯飞已经和许多龙头企业,在招采产品中进行了合作落地,成功跑通流程。

发布会上,一位重量级嘉宾的出现很有说服力——国家能源集团物资有限公司科技信息部主任朱捷。
作为「智能评审的开创者」,朱捷分享了一个震撼的数据:
他们早已不仅是试用,而是实现了「智能无人评审」的规模化应用。
在集团内部,AI已辅助评审订单高达18万单,评审准确率已超过97%。
判断四:这是一条「不可逆」的单行道
招采属于企业最敏感、最难回退的系统之一,一旦引入AI,回退成本极高。
讯飞「招采智能体平台」,正体现了这一不可逆性。
不可逆的核心在于,一旦企业尝试到AI带来高效率、公平公正与全链路优化,就不可能再心甘情愿退回到传统低效率模式。
想象一下,过去海量标书评审,人工耗费数小时甚至数天,异常行为检测依赖专家主观判断。
如今,通过平台实现多维度风险预警与人机协同,让企业招采效率跃升,运营成本大幅降低。
这意味着,招采领域的Agent应用,正在从实验期走向了真正的落地期。
为什么是科大讯飞?
在AI Agent这条赛道上,几乎所有的科技大厂都下了重注,而且还有无数的初创前仆后继。
为什么偏偏是科大讯飞,在招采这个细分但极度重要的领域跑通了?
答案可能藏在三个关键词里:「底座」、「领域」与「数据」。
在当前的国际局势下,央国企对数据安全和供应链安全的考量处于最高优先级。
科大讯飞与华为联手打造的「飞星一号/二号」平台,构建了纯国产的算力底座。

这种在硬件层面的自主可控,是其他依赖海外GPU的厂商无法比拟的护城河。
招采业务极其考验多模态能力——既要看懂晦涩的法律文本,又要看懂复杂的工程图纸,还要比对公章的真伪。
讯飞星火大模型长期的迭代,尤其是其在图文理解上的优势,恰好匹配了招采的痛点。
除了招采领域,基于讯飞星火大模型底座,打造的垂类模型早已遍地开花。
星火医疗大模型深度赋能诊疗、健康交互等多场景;星火法律大模型打造AI专属顾问,让法律咨询服务公平可及....
这些生动的实践,正是讯飞「1+N」战略布局的有力印证,让通专结合的模式脱颖而出。
更深一层看,「通专结合」之所以真正落地,并不是只因为底座强、垂类多,而是它天然具备了跑出数据飞轮的条件。
一方面,大模型提供了强泛化的理解与推理能力,能把招采复杂场景先跑通;另一方面,垂类模型和智能体钉进具体环节,让LLM在真实业务中获得高密度的反馈。
由此,便形成了越用越准、越准越用的闭环。
比如,合肥公共资源交易中心,就利用「智慧交易智能体」将一致性提升到了95%。
还有如上提到的国家能源集团的智能评审系统,已辅助评审订单高达18万单,准确率超97%。
这种在央企实战中打磨出来的算法精度和业务逻辑,是任何实验室里都跑不出来的数据壁垒。
目前,讯飞在AI招采的市场份额持续领先。

从中国石油到国家电投,这些掌握着国家经济命脉的巨头们,不约而同地成为了讯飞的合作伙伴。
这些行业巨头的率先采用与成功实践,有力证明了AI在复杂B端场景的可行性。
如今,当AI Agent开始在招采这样严谨、复杂的领域挑起大梁,我们有理由相信,2026年,确实会成为一个分水岭。
它标志着AI从「玩具」变成了「工具」,从「副驾驶」坐到了「主驾驶」。
对于所有的企业管理者来说,现在的问题已经不是「要不要用AI」,而是——
「你的业务流程,准备好迎接一位硅基新同事了吗?」
文章来自于微信公众号 “新智元”,作者 “新智元”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0