「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样
6818点击    2026-04-16 12:29

40克AI眼镜变身Agent之眼,数字分身定制分身。当Agent爬出屏幕走进物理世界,这场关于生产力的降维打击,真的不只是说说而已。


这几个月,硅谷和中文AI圈都在流传一个心照不宣的暗号,「养龙虾」。


一个Agent,7x24小时不睡觉,自主开浏览器、写代码、抓数据、交付成果……


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


这些「龙虾」一度被视为未来的生产力神话,然而,它们所有的演进路径,都指向同一个终点:


怎么在一块屏幕里,把活干得更猛一点。


所谓的「AI员工」,本质上是一个被钉死在屏幕背后的同事。下一代Agent,究竟该如何突破玻璃的束缚?


4月15日,广交会开幕当天,有人试着把这道坎跨过去。


一副40克的眼镜;一颗装进机器人脑袋里的「超脑」;一个能跨设备接力干活的桌面搭子;再加上底层重新升级的AstronClaw平台,整套「Claw全家桶」一次性砸了下来。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样

佩戴讯飞AI眼镜的多模交互场景


干这件事的是讯飞。


所有这些硬件、软件、模型、平台的更新,都指向了同一件事——


把Agent从屏幕里拽出来,让AI真正触手可及!


这一次,「龙虾」冲出了屏幕


要做到这一点,第一步,是先给「龙虾」一副能够看见世界的身体。


硬件,才是Agent走出屏幕的第一道门。


讯飞AI眼镜:Agent有了眼睛


讯飞翻译硬件家族里最轻的那一块,是一副眼镜。


讯飞AI眼镜整机,仅40克。


作为全球最轻的双目单色显示多模态眼镜,它比市面主流产品(50克以上)减重约20%。


重量只是入场券。讯飞AI眼镜搭载的GlassClaw,才真正改变了Agent的输入方式。


你看到什么,它就能识别和理解;你听到什么语言,它就实时翻译。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


跨语言方面,中英首响快至2秒,AR翻译目光锁定2秒就能自动出译,加上18个离线语种,基本覆盖了广交会这种跨国采购场景的刚需。


更硬的技术活,藏在降噪方案里。讯飞AI眼镜首创了「唇动识别」多模态降噪方案,靠5+1麦克风阵列加骨传导,最远拾音距离8米。把声源定位从「听哪个方向」变成「看谁的嘴在动」。


发布会现场,新华社记者徐弘毅戴上讯飞AI眼镜,在科大讯飞展台跑了一段相当能打的实操。


展台老师在讲解讯飞AI翻译耳机时,讯飞AI眼镜同时捕获语音和图像。多模态数据传到AstronClaw,然后给徐弘毅补上了一段背景——


这款耳机是全球首款骨导加气导的开放式专业翻译耳机。 


去年在上海和迪拜两地同步发布,当时还做了一场跨国翻译电话演示。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


最关键的环节在最后。徐弘毅扶了一下眼镜,说了一句话——


「根据我刚刚逛展的过程,生成相关素材发送到微信」。


GlassClaw把展区一路看到、听到的内容整理成图文素材,发到了展台工作人员的微信里。从看到、认知、理解、思考到输出,一口气搞定全流程。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


当Agent的输入从屏幕里的文字,变成眼前的真实世界,人机交互的范式就被重写了。


Agent不再需要你一字一句地把世界描述给它听,它自己就能看。


Claw直控机器人,送咖啡热舞震撼


如果GlassClaw是Agent的眼睛,Claw就是Agent的神经中枢。


主持人直接在AstronClaw下达一句指令:Guide 01,给我送杯咖啡。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


然后,AstronClaw操控讯飞Guide 01机器人,提着咖啡慢慢走向台前,递给了主持人。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


更惊艳的还在后头。Guide 01把舞台交给了它的「WallEX」和「小弟Nova」。


其中,WallEX是升级了Claw能力的智慧家居中控屏。Nova是配套氛围灯,会根据场景自动调色,主打家居里的浪漫氛围。


现场,机器人用一支舞,把这一组合的感染力瞬间拉满。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


这次Claw接入Guide 01,瞄准的是机器人行业一个老大难:语音交互和动作执行严重割裂。


过去机器人听懂一句话和做成一件事之间,隔着一层厚厚的代码。


一句简单指令往往要被拆成一连串动作,稍微复杂一点开发成本就指数级往上窜。


Claw打通了这一层。


它把AstronClaw的任务编排能力、讯飞机器人超脑平台、星火大模型、多模态交互技术深度融合,跑出的是一条完整链路:


自然交互理解 → 多传感器融合 → 自主任务规划 → 物理端执行


通过「软硬一体」模组的形式,任何机器人厂商都可以快速集成。


这等于给整个行业交了一份标准答案。机器人厂商不用再自己啃Agent这块骨头,Claw就是一个即插即用的Agent大脑模块。


家居场景的智能终端怎么接进Agent生态,讯飞给的答案和机器人是同一个,都接进同一套任务编排和上下文里。


「眼睛」和「手脚」都有了,Agent已经能看、能动。


但真正要把活干完、干好,还得有一套能把任务串起来、记得住上下文的软件中枢。


它叫AstronClaw。


聊天框装不下的活,AstronClaw接住了


过去的AstronClaw更像一个能干的网页助手,在浏览器里派活,云端把活干完。


这套「养龙虾」模式3月上线之后迅速跑通。订阅从16.8元/月起步,企业级Agent的门槛被压到了一杯咖啡钱。


这里顺带说一件事。开篇提到的那个OpenClaw,中国信通院4月刚出了一份《OpenClaw类智能体部署风险管理指南》。行业开始给「养龙虾」这件事划安全底线了。


最重要的是,科大讯飞成为首批通过自检的厂商之一。


这在一定程度上证明了AstronClaw在安全架构、任务执行隔离、数据处理规范等方面,已经具备了进入企业核心场景的能力。


不过,聊天框有聊天框的天花板。


一个任务从手机切到电脑再切到会议室,Agent就断片,每次交互都是一次重新开始。这是所有对话界面智能体绕不开的坎。


这一次,AstronClaw的升级,直接动了底层架构。


第一刀砍在端云协同。


复杂任务不再绑在单一设备上,云端负责思考和规划,终端负责现场执行。


一个任务从办公本发起,可以在手机上继续推进,再推到电脑收尾,换设备不断片。


第二刀砍在跨端记忆同步。


Agent记得自己走到了哪一步,也记得你上次提过什么要求。


用讯飞自己的话说,这是「像接力赛一样持续推进」。Agent从一次性聊天,变成了一条不会断的任务流。


还有一刀砍在生态接口。


硬件连接协议这次一起开放,不同类型的智能设备都能快速接入AstronClaw。前面那只机器人和那副眼镜,背后跑的就是这套协议。


目前,讯飞把第一台跨设备接力的Agent装在自家办公本X5上。


发布会上,主持人对办公本说一句话,刚才在AstronClaw云端生成的逛展攻略和个人行程就同步了过来。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


Loomy:上传一张照片,造一个数字分身


AstronClaw是云端那只龙虾,Loomy是钻进你电脑里的那只。


3月发布的Loomy已经跑通了基本能力。目录级隔离让AI不越雷池半步。


QQ、飞书、钉钉、微信四大IM接入,手机就是远程控制台,首发期赠送积分,新用户无门槛就能上手。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


这一次的升级,Loomy要从桌面工具变成长期协作伙伴。


会议中自动整理纪要、安排日程、跟进任务进度这些事,从「你得打开软件操作」变成了「你开口它去做」。


更有趣的,是这次新加的Buddy。


只需上传一张照片,加一段极具个人性格特色、工作风格的文本描述,就能量身定制一个外貌、风格相似的数字分身。


它可以成为你的「工作搭子」,更懂你自己,并处理一系列工作任务。


这不,现场主持人万里怼脸演示「万里Loomy」全程搭建过程,她把自己平时一些特点扔给Loomy:


喜欢回复111、不喜欢拖拉、做事责任感强、容易焦虑愤怒


它会调用soul-creator技能,把万里的说话风格、特点、价值观写入soul档案中,最终生成一个万里Loomy。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


接下来万里现场出了个考题:「领导开会三四十分钟还没进入正题,怎么打断?」万里Loomy一口气给了五个高情商方法,最后一条是「实在不行就忍」。另一位主持人马高听完插了一句「咱俩共用一个老板」,全场笑场。


这就是Buddy「懂你」的真实样子,它给你的不是一个标准答案,是一个像你自己会写的答案。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


而且,在Loomy中可以创建多个Buddy,处理各种各样的工作任务。


比如,讯飞刘庆峰董事长没来现场,让已创建好的刘总Buddy,以其风格生成一段40s发言,给现场打打气。


这种真实感,只能用「震撼」形容。不仅声音像素级还原,竟连演讲中标志性语调、鼓舞风格都与刘庆峰本人如出一辙。


合成语音里那句「用人工智能建设美好世界的使命」,全场静了几秒。


有了Loomy数字分身,真正的需求还是让它去完成手里的案头工作,比如PPT、视频、宣传文案。


现场,万里Loomy一口气调用了三个原生Skill,把广交会的案头活全清了——


  • 智文Skill写了一份广交会复盘PPT。据现场介绍,智文Skill的原生应用已经突破1000万用户。


  • 智作Skill做了一条围绕讯飞AI眼镜的宣传视频,用的是万里自己的数字分身做出镜。


  • 绘文Skill写了一篇广交会的报道文章,并在两个第三方自媒体平台预发布等待审核。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


可以看到,以上这些都是「通用型」案头任务。在广交会上,最典型的还是采买任务。


招采Claw抓出围串标,陪练AI赛博实战


别急,这里就轮到企业级智能体出场了。


最重要的「招采Claw」,深度融合了AstronClaw、SkillHub和招采知识库的招采助手。


发布会上,主持人把整套招采文件一口气全部上传,招采Claw自动调用文件解析Skill。


它先把复杂标书规整化处理,方便后面定位每一处细节。然后像专家一样,开始检测围串标风险。很快抓出两家公司的标书里用了同一张图片,判定为围串标,取消两家资格。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


接下来是资质评审。招采Claw发现一家公司的工程资质是乙级,但招标文件明确要求甲级,排除。


最后两步,是初评和复审。招采Claw这里没有派单个Agent上场,而是拉起了一个Agent Team。


每家入围企业分配一个子Agent专门跟进,主Agent负责统筹。复审环节再细分。


业绩评审、施工组织、项目团队、环境保护各派一个专精Agent,互不干扰、并行推进,最后由主Agent合稿出报告。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


可不要小瞧这一过程。发现相似图表、资质不合格等细节,以往要耗费多位专家时间和精力。招采Claw把专家从繁琐活里解放出来,时间花在决策、谈判、把控风险上,效率成倍提升。


这是Agent Team多智能体协同第一次跑在一个真实的企业级场景里,也是这次发布会最炸的卖点之一。


职场中,通常对打工提出了更高的要求:深谙行业各种know-how,成为多技能人才。


这不,陪练skill,企业员工专业培训的「赛博老师」能救你。


它调用了「星火陪练」的技能,与Claw一起生成一个真实的模拟场景。


主持人在「招采讨价还价」的模拟里挑了个独家供应商「何总」,十几年经验,一上来就咄咄逼人。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


两轮交锋下来,最终以8%让价、60天账期、合同写最低采购量收尾,AI给的成绩是90分。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


评审报告还按节奏掌控力、风格控制力等维度给出了详细分析。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


招采陪练做的是新人训练。AI模拟供应商和采购员对话,把几个月实战压缩成几十轮对话。


SkillHub:企业技能的「军火库」


以上提到的陪练Skill,这么多讯飞Skill可以在哪里用得上?


它们全部都放在了技能仓库—— Astron SkillHub中。它是管理AI技能的「企业版NPM」,国内首个企业级自托管的开源技能平台。


「龙虾」从屏幕里爬出来了!现场复刻老板发言,连语调都一模一样


技能、数据、日志都留在企业自有环境里,数据主权完全在自己手里。


企业里真正值钱的东西,往往是资深员工踩过坑沉淀下来的prompt、脚本文件以及工作流。


这些东西过去散落在聊天记录、笔记和模板文件里,人一走,流程也跟着走。


SkillHub做的就是把这类工作流打包成版本化、权限化、可审计的技能,存进公司的私有仓库。


新员工一个命令就能调用。


到现在,SkillHub上的开源Skill已经超过3000个,由海内外开发者共同维护。


生态兼容性上,SkillHub完全兼容ClawHub CLI协议。一次发布,AstronClaw、OpenClaw、Loomy都能一键下载、安装和调用。


到这里,「Claw全家桶」的全貌已经摆出来了——


GlassClaw在物理世界负责感知和执行,WallEX覆盖家居场景; AstronClaw在云端调度任务,Loomy在桌面当协作伙伴和数字分身,SkillHub把企业的技能资产沉淀下来。


市面上,几乎所有厂商都在说自己软硬一体,但真能做到的没几家。


原因很简单,「堆料」不难,难的是往下打得穿。


讯飞的差异化不是「做得全」,是「每一层都是自己的」。


从自研大模型、自建平台、自造硬件、自养开发者生态,这四件事但凡缺一件,这根主干就断了。


眼睛看到的、手脚执行的、桌面协作的、企业沉淀的,最后都要汇到同一个大脑里。


而能不能汇得通,答案全在底座。


标王连庄,靠的是十六年家底


说了这么多,最终所有的线索都指向了一个必须回答的问题:凭什么是讯飞?


先上数据。2025年全年,讯飞拿到了210个中标项目,23.16亿中标金额。数量和金额两项都是第一,蝉联2025年大模型「标王」。


也就是说,讯飞一家的中标金额,大幅超过了榜单上后面几家披露金额的总和。


更关键的是分布。教育、医疗、金融、通信、能源、政务六大行业全线覆盖,80%以上是应用类项目,真正落地到了企业业务流。


数字背后是具体的项目。


讯飞拿下了安徽省人工智能应用中试基地,深耕医学垂类模型,承担全省试点的那一环。


国家能源集团用「OCR+星火大模型」打造智能无人评审系统,率先在非招采购全类别、全方式的业务跑通。


西安铁路通过星火知识库与讯飞智文,将大模型能力平替进大基建基层的日常办公流。


尤其要拎出来说的是美团。基于星火大模型的AI文案和AI脚本,已经在旗下多个产品上线。这一条的分量不在于单子大小,在于客户是谁。一线C端互联网大厂接入讯飞的大模型底层,是客户光谱里的新面孔。


而所有这些项目背后,是一个从2010年长起来的开放平台。


截至2026年3月31日,讯飞开放平台已经沉淀1074万开发者团队、931项AI产品、403万应用、43.1亿台终端设备。十六年家底。光星火发布以来就新增664万开发者,大模型相关开发者253万。


能做Agent生态整合的公司不止一家。但能把生态、模型、硬件、落地经验全部凑齐的,没几家。


当龙虾走出聊天框


当Agent有了眼睛、耳朵和手,它要解决的问题就变了。不再是「如何回答得更聪明」。是「如何把事情真的做完」。


一年前,AI圈刚开始流行养龙虾的时候,没人说过龙虾有一天会爬出鱼缸。


现在它爬出来了。


下一个问题不再是它能不能替人干活。是它走到哪家工厂、哪个会议室、哪个展台,就会先改变哪里。


文章来自于"新智元",作者 "好困 桃子"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0