Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺
7165点击    2026-02-23 18:28


你所在的行业,可能还没见过哪怕一分钟的AI智能体。


这个事实本身蕴含着巨大的机会。


2026年2月18日,Anthropic发布了一份关于AI智能体实际使用情况的大规模研究报告(报告:https://anthropic.com/research/measuring-agent-autonomy,分析对象是其公共API上数百万次真实的人机交互。


报告的核心发现可以浓缩成一张柱状图。


Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺


软件工程独占了49.7%的智能体工具调用量,像一根拔地而起的烟囱。


剩下的16个垂直行业——医疗、法律、金融、教育、客服、物流,每一个的份额都是个位数:医疗1%。法律0.9%。教育1.8%,没有任何一个超过9%。


Y Combinator的CEO陈嘉兴(Garry Tan)盯着这张图,得出了一个让很多创业者坐不住的结论:那片几乎空白的区域,藏着下一代300个独角兽。


他的原话更直白:「如果我今天创业,我会盯着那张柱状图上那一大片红色区域,直到从中看到自己的未来。」


你的AI比你以为的能干得多


这份报告里有一组数据,适合贴在每个产品经理的工位上。


独立评估机构METR的测试结果显示,Claude已经能够独立完成需要人类近5小时才能搞定的工作。然而在实际使用中,即便是全球最激进的那批用户(统计意义上的第99.9百分位),单次让AI连续工作的时长也不过42分钟左右。


Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺


5小时的能力,42分钟的授权。


这中间巨大的落差,陈嘉兴给它起了个名字叫「部署积压」(deployment overhang)。


翻译成大白话就是:AI已经准备好了,人还没准备好。


好消息是,人正在追赶。


从2025年10月到2026年1月,这个第99.9百分位的会话时长几乎翻了一倍,从不到25分钟涨到42分钟。


值得留意的是,这条增长曲线非常平滑,并没有因为新模型的发布出现突然跳升。


换句话说,驱动变化的主力不是模型变聪明了,而是人类在一次又一次的协作中,学会了慢慢松手。


Anthropic内部的使用数据印证了同样的趋势。


2025年8月到12月,Claude Code在最困难任务上的成功率翻倍,每次会话中人工介入的次数从5.4次降到了3.3次。


对于正在考虑创业方向的人来说,这意味着一件很具体的事:窗口期还在。


绝大多数行业甚至还没开始认真尝试让AI智能体介入自己的核心工作流。


不是技术不行,是信任还没到。


老手更敢放手,也更敢叫停


关于人和AI如何磨合出默契,这份报告讲了一个很有意思的故事。


刚开始用Claude Code的人,只有大约20%的会话选择了「全自动批准」模式——也就是让AI自己跑,不用每一步都等人点头。


累计使用超过750次之后,这个比例上升到40%以上。


信任在日复一日的使用中缓慢生长,可以被精确测量。


反直觉的地方在于:那些更愿意放手让AI跑的老用户,同时也更频繁地打断它。


新手的打断率大约是5%,老手反而到了9%。


Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺


这看起来矛盾,其实是两种截然不同的工作方式。


新手像是在考场上监考,AI每写一道题都要看一眼。


老手更像是委托了一个信得过的下属,平时不盯着,一旦感觉方向不对立刻喊停。


从「逐项审批」到「委托+监控」,这种转变对理解人机协作的未来至关重要。


另一个容易被忽视的细节:在复杂任务中,Claude主动暂停来向用户确认的次数,是用户主动打断它的两倍还多。


AI在拿不准的时候会停下来问一声,而非闷头往前冲。


Anthropic的研究团队提炼出一个核心概念来描述这种动态——「共建」。


AI智能体的自主程度,不是模型单方面决定的。


它由三方力量塑造:模型在不确定时选择暂停,用户随经验调整监管尺度,产品设计在中间架设桥梁。


这个发现直指当下最热的AI监管争论。


如果政策要求人类必须「逐项审批AI的每一个动作」,结果大概率是生产力被扼杀,安全性却没有实质提升。


报告中的数据也支持了这种判断:73%的工具调用有人在回路中监管,仅0.8%的操作属于不可逆类型。


而那些看起来高风险的极端案例(API密钥操作、自主加密货币交易),经核实大多是安全团队做的红队演练,不是真实生产场景。


护城河在行业里,不在模型里


看到这里,可能有人要问:既然垂直行业机会这么大,为什么大家都挤在软件工程里?


答案并不复杂。


代码是可测试、可回滚、出错成本低的——写坏了一段代码,最多回退一个版本。


但你让AI帮一个病人处理医保报销,或者替律师做证据开示,出了错可能是一场诉讼。


软件工程的智能体渗透率高,本质上是因为这个领域的「容错空间」最宽裕。


Box的CEO Aaron Levie点出了垂直AI创业的真正壁垒所在:能把遗留工作流吃透,能在监管的夹缝中找到产品路径,能帮客户推动组织内部的变革。


Anthropic最新报告,揭示了300个独角兽的创业机会!YC CEO力挺


谁都可以在大模型外面包一层界面做个「AI壳」。


但要让智能体在医疗账单审核、法律合同检索或建筑许可审批这些场景里真正跑起来,创业者必须比客户自己还懂那个行业的痛点和雷区。


这也是为什么陈嘉兴认为垂直AI公司天然具备防御性。


他提了一笔大账:过去二十年,SaaS行业每十年规模增长十倍,超过40%的风险投资流入了SaaS公司,催生了300多个独角兽。


他的核心推演是——这300多个独角兽,每一个都对应着一个垂直AI版本等待被创造;而AI版本的天花板可能是SaaS版本的十倍,因为它替代的不只是软件本身,还有操作软件的那些人。


Bessemer Venture Partners在2025年的一份研究中给出了类似的判断:美国劳工统计局的数据显示,软件支出仅占美国GDP的1%,而由重复性语言任务主导的商业与专业服务行业占到13%。


垂直AI的潜在市场不在于抢占现有软件的份额,而在于切入那些软件从未触及的服务经济腹地。


放到中国语境下,这个逻辑同样成立,甚至空间更大。


中国企业级市场的一个显著特征是供给端偏爱通用化、标准化的产品,而需求端渴望的是能够深入特定行业流程的定制方案。


叠加数据孤岛和组织协同壁垒,这种供需错配反而为垂直AI创业者提供了结构性的保护。


Gartner预测,到2026年底约40%的企业应用将集成任务型AI Agent——2025年这个数字还不到5%。


我们正站在从实验到规模化的临界点上。


图已经画好了


软件工程这块地盘基本已经有主了。


但医疗、法律、金融、教育、客服、物流——16个垂直行业各自只占个位数的份额,几乎是一片未经开垦的土地。


如果你是一个正在选方向的创业者,或者是一个在传统行业里每天处理大量重复性工作的从业者,这份报告指向的信号很明确:你日常工作中那些让你疲惫又无聊的环节,很可能就是下一个独角兽公司的起点。


那些你每天重复填写的表格、反复核对的数据、来回扯皮的审批流程,在AI智能体的视角里都是尚未被开发的矿脉。


模型已经具备连续工作五小时的能力,用户目前只让它跑42分钟。


TechCrunch在2025年底调研了24位专注企业市场的风险投资人,压倒性的共识是2026年将成为企业真正从AI中看到回报的一年。


与此同时,麦肯锡的数据显示92%的企业计划在未来三年增加AI投资,但只有1%认为自己已经进入成熟部署阶段。


也就是说,几乎所有人都知道要往这个方向走,几乎所有人都还站在起跑线上。


陈嘉兴的总结很简练:300个SaaS独角兽已经来过了,300个垂直AI独角兽即将到来。


赢家属于那些选准一个行业扎进去、把领域知识编织进智能体、同时能帮客户完成变革管理的创始人。


每一轮技术革命最丰厚的回报,往往不属于铸造锤子的人,而属于那些清楚该往哪面墙上敲的人。


参考资料:


https://anthropic.com/research/measuring-agent-autonomy


https://garryslist.org/posts/half-the-ai-agent-market-is-one-category-the-rest-is-wide-open


文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md