AI奇观:我在主会场卷,SoulAgent在20余个分会场替我听会

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI奇观:我在主会场卷,SoulAgent在20余个分会场替我听会
8311点击    2026-06-23 15:21

AI Agent已经不缺了。


但一个问题也越来越明显——很多Agent看起来能力很多,本质上仍然停留在「聊天框+工具调用」的阶段:用户问一句,它答一句;用户下一个指令,它执行一个任务。


它很聪明,但不真正了解用户;它能处理信息,但不能替用户感知世界;它能记住上下文,却很难沉淀成你的长期认知。


在2026智源大会上,SoulAgent正式亮相,试图给出一个新的答案:AI不该只是工具,而应该成为每个人的数字分身。


SoulAgent提出了一个清晰的产品架构:Soul是第二大脑,负责理解用户、记住用户、沉淀用户的认知;Agent是执行之手,负责感知世界、调度能力、完成任务。


SoulAgent要做的是一个真正面向个人的专属智能体:越用越懂你。


也就是越用,越贴近用户的目标、偏好、知识结构和思考方式,最终成为陪伴每个人长期成长的数字分身


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


从聊天框到「数字分身」


AI需要解决的新问题


过去几年,大模型解决了很多问题。


它可以写文章、做总结、查资料、写代码、生成图片、分析文档。对于很多人来说,AI已经成为日常工作里的高频工具。


但当AI越来越普及,新的问题开始出现:


工具变多了,但真正懂用户的人机关系并没有建立起来。


今天的大多数AI产品,依然有三个明显限制。


第一,依赖用户主动发起。


用户不问,它就不动;用户没有把任务说清楚,它就很难主动判断下一步应该做什么。


第二,缺乏长期认知。


它可以完成一次对话、一次搜索、一次总结,却很难持续理解一个人的长期目标、知识结构、偏好习惯和决策方式。


第三,无法同步「参与」现场。


它可以检索已经沉淀下来的资料,却很难替用户参与正在发生的信息现场,比如一场会议、一次直播、一组并行论坛、一个持续推进的项目。


所以,下一代个人AI真正要解决的,不只是「能不能回答得更好」,而是三个更关键的问题:


能不能替用户感知世界?


能不能沉淀用户自己的认知?


能不能在长期陪伴中,真正理解一个人?


SoulAgent正是围绕这三个问题展开。


智源大会现场


SoulAgent替用户「参与」现场


本届智源大会开设了20余场并行分论坛。


对参会者来说,这几乎是一个无法避免的痛点:想听主论坛,就会错过分论坛;想关注多个方向,就一定分身乏术;会后再看资料,又很难还原现场语境和观点交锋。


SoulAgent在现场给出的答案很直接:用户只需要在一个会场,SoulAgent可以替用户同步感知其他会场。


大会期间,SoulAgent接入多场论坛直播流,对现场内容进行实时感知、实时理解和结构化沉淀。


嘉宾刚刚讲到的观点,用户很快就可以直接追问:「AI-Native教育的圆桌讲到哪儿了?」、「智源研究院院长王仲远在开幕式讲了什么?」、「不同嘉宾对世界模型的判断有什么差异?」、「今天哪些论坛提到了具身智能?」


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


上下滑动查看


SoulAgent给出的不是搜索引擎里的旧资料,也不是会后统一整理出来的纪要,而是来自大会现场的一手信息。


这也是这次演示最关键的地方。它不是简单的语音转写,也不是传统会议纪要。


更准确地说,SoulAgent展示的是一种新的信息获取方式:


让AI成为用户的数字感官,替用户同步「参与」正在发生的信息现场。


当用户坐在主论坛时,SoulAgent可以同步参与其他分论坛;当用户错过某场报告时,SoulAgent已经替用户完成了听会、理解和整理;当用户需要复盘大会时,SoulAgent不只是给出摘要,而是可以围绕用户关心的问题继续追问、对比和展开。


智源研究院产品负责人兼SoulAgent负责人焦岩策表示:


「听会只是最低门槛的应用入口。真正重要的是,Agent的价值正在从完成任务,变成感知世界,替用户在场。」


这句话,也点出了SoulAgent和传统AI助手之间最核心的差异。传统AI助手更像一个能力很强的工具箱。


而SoulAgent想做的,是让AI成为用户的长期感知系统和认知伙伴。


SoulAgent到底是什么?


一句话:数字分身


SoulAgent作为数字分身,其产品逻辑可以拆成两部分:


Soul,是第二大脑。它负责理解用户,沉淀长期记忆,形成个人认知模型。


Agent,是执行之手。它负责感知外部世界,调用工具能力,完成任务,推动结果落地。


这套「脑手分离」的架构,试图解决今天AI产品里一个很核心的矛盾:只会执行任务,不够懂用户;只会聊天陪伴,又无法真正办事。


SoulAgent想做的,是把「理解人」和「完成事」真正合在一起:既能理解用户,也能替用户行动;既能沉淀认知,也能感知世界;既能陪用户思考,也能帮用户完成任务。


最终,它要创造的不是一个聊天窗口,而是一个围绕每个人持续生长的个人数字世界。


这个数字世界不是一次性生成的,而是在每一次对话、每一次听会、每一次任务执行、每一次知识沉淀中不断生长。


你使用得越多,SoulAgent就越理解用户的关注点、表达习惯、判断逻辑和长期目标,最终从一个AI工具,变成真正属于用户的专属智能体。


基于这一方向,SoulAgent依托智源研究院自研Agent框架SoulPilot本次率先落地了两大核心能力:


第一,是面向每个人的个人专属智能体


除了能帮用户听会之外,它让AI不再只是记住几轮对话,而是长期理解一个人的目标、偏好、记忆和思维方式,越用越懂你,逐步成长为真正专属的第二大脑。


第二,是面向顶尖智慧的专家思维分身


它让普通用户不再只能被动阅读专家观点,而是可以随时进入专家的思考现场,围绕真实问题展开持续追问和深度对话。


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


SoulAgent框架SoulPilot-支撑「数字分身」的工程底座


SoulAgent能力真正落地,背后需要一套全新的智能体运行时架构。


SoulPilot基于全新自研架构从零构建,面向云端运行、高并发、低延迟运行环境设计。


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


SoulAgent当前运行在云端沙箱,支持7*24小时不间断执行agent任务。


为了适配大规模云端沙箱agent任务执行,减少云资源的使用,SoulPilot利用实例池化与按需唤醒的能力,将空闲会话自动回收至低功耗待命状态、有任务时毫秒级恢复执行,使单位用户的云资源占用相比传统方案降低约80%。


另外,多轮对话越长,消耗的Token就越多。


SoulPilot采用两阶段压缩策略来解决这个问题:


  • 第一阶段是规则化裁剪——自动识别并压缩过长的工具返回结果和冗余内容,这一步不消耗任何额外算力。
  • 第二阶段才对历史对话进行智能摘要,保留关键信息的同时大幅缩减Token用量。


更重要的是,系统内置了防抖动机制:压缩之后需要累积足够多的新内容才会再次触发,避免反复压缩造成浪费。


同时,系统提示词采用静态与动态分层设计,压缩操作不会破坏缓存命中,进一步降低推理成本。


最终实现30% Token成本的节省。


当面对复杂任务时,SoulPilot不是串行地一步步执行,而是多智能体协同,一个指令调动多路能力


主代理可以同时派出多个子代理——一个负责检索资料,一个负责分析数据,一个负责生成报告——然后统一汇总结果。


子代理之间通过内置信箱进行实时通信,父代理可以随时收到进展并动态调整策略。


为了安全,系统对子代理的「派生深度」设有硬限制,同时通过角色化权限控制确保不同类型的代理只能访问其职责范围内的工具——比如探索类代理只能读取信息,不能修改任何内容。


记忆梦境引擎,这是SoulPilot「长期认知」能力的技术支撑。


SoulPilot的梦境引擎在对话间隙自动执行类似的「记忆整理」:增量扫描新产生的对话,从中提取对话摘要、可复用的操作模式、用户的偏好反馈和项目知识,分层归档为会话级、日级、周级的认知档案。


更关键的是,当上下文压缩触发时,梦境引擎会在压缩前抢先完成知识保全——确保对话中有价值的认知不会因为窗口压缩而被丢弃。


这就是为什么SoulAgent能越用越懂你,而不是随着对话变长反而「失忆」。


为了保护用户使用安全,SoulPilot构建了三层安全体系:


第一,入口防护。文件加载时自动审计内容,识别并阻断潜在的提示词注入攻击。


第二,输出防护。基于指纹比对技术,在AI回复的流式输出过程中实时检测是否泄漏了关键信息,一旦发现异常,立即阻断输出,将泄漏控制在极少量字符内。


第三,工具防护。沙箱机制屏蔽敏感路径和危险操作,保障执行安全。


SoulAgent核心能力之一:


面向每个人的个人专属智能体


今天很多AI助手都在强调「长上下文」。但SoulAgent并不只是把上下文窗口做得更长,而是试图构建一个更完整的东西:Life Context,人生上下文。


所谓人生上下文,不是简单记住某一次对话里用户说过什么,而是持续理解一个人的长期目标、知识结构、兴趣偏好、历史决策、工作项目和正在关注的信息流。


它关心的不是「这轮对话怎么接」,而是「这个人长期在想什么、正在做什么、真正需要什么」。


这背后,对应的是SoulAgent的五个能力升级。


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


第一,从搜索信息,到亲历信息。搜索引擎解决的是「帮用户找到信息」。


大模型解决的是「帮用户理解信息」。SoulAgent要解决的是另一个问题:人无法同时出现在所有地方,但AI可以替用户在场。


在智源大会场景里,这一点已经被直观展示出来:用户无法同时参加20余场论坛,但SoulAgent可以并行感知、理解和沉淀。


未来,这种能力可以延伸到更多信息现场:会议、课程、直播、行业大会、项目讨论、团队协作。


Agent不再只是等用户有需求之后帮用户总结,而是在信息发生的同时,就已经先替用户完成了第一轮理解。


第二,从被动问答,到持续感知。


传统AI助手的逻辑是:你问,它答。你不问,它就沉默。而SoulAgent想改变这个交互方式。


AI持续感知世界,再主动把重要信息带给用户。


它可以持续听会、持续阅读文档、持续观察项目进展、持续整理知识线索。


这意味着,AI不再只是一个聊天窗口,而会逐渐变成用户的数字感官。它知道用户正在关注什么,也知道外部世界正在发生什么。


当两者产生关联时,它可以主动提醒用户、帮助用户、推动用户行动。


第三,从临时上下文,到长期认知。


大多数AI产品的记忆,仍然是碎片化的。它可能记得用户喜欢某种表达方式,也可能记得用户上次问过什么问题,但很难真正理解用户的长期目标。


SoulAgent要沉淀的不是简单记忆,而是长期认知:用户在关注哪些方向;用户做过哪些判断;用户有哪些知识盲区;用户习惯怎样取舍;用户长期想达成什么目标。


一个真正有用的AI,不应该每次都从零开始认识用户,而应该越用越懂你。


第四,从效率工具,到认知第二大脑。


AI最先帮助人的,是完成一些明确任务。


但SoulAgent想接管的,是大量重复性认知劳动:会议复盘、知识整理、信息归档、观点对比、风险提醒、任务追踪、跨场景关联。


这些事情不难,但极其消耗人。


SoulAgent的价值,就是把这些低效、重复、容易遗忘的认知工作交给AI,让人把注意力留给更高阶的判断、创造和决策。


它不是简单帮用户省几分钟,而是帮用户建立一个持续复利的个人认知系统。


第五,从第二大脑,到个人数字世界。


当AI能长期理解用户,又能持续感知世界,还能替用户执行任务,人机关系就会发生变化。


用户不再只是向AI提问,而是和AI一起工作、一起思考、一起成长。用户负责判断方向,AI负责感知信息、整理认知、推进任务。


比如用户在主会场听报告,AI替用户听其他论坛;用户在做核心决策,AI替用户整理所有背景资料;用户休息时,AI替用户复盘当天信息;用户忙于主线工作时,AI替用户并行推进其他任务。这不是「AI替代人」,而是「AI放大人」。


最终,SoulAgent想创造的是一个围绕个人持续生长的数字世界:它以用户的记忆、目标、偏好和工作流为中心,不断感知、沉淀、更新和行动。


SoulAgent核心能力之二:


专家分身,不只是「模仿说话」


除了现场听会,SoulAgent现场还展示了另一个核心能力:专家分身。


AI奇观:我在主会场卷,Agent在20余个分会场替我听会


为什么专家分身重要?因为顶尖思维太稀缺了。


学术和产业里一直存在一个结构性问题:顶尖专家的思考深度足够强,但触达门槛极高;通用AI覆盖面足够广,但缺少真正的专家判断深度。


普通学生、研究者、创业者、企业技术负责人,很难随时获得顶级专家的一对一指导。


SoulAgent专家分身试图解决的,就是这个问题:把稀缺的专家思维数字化,让更多人可以低成本获得高质量认知陪伴。


它不是简单传播知识,而是传播思考方式。这件事的价值,远远大于一篇文章、一场讲座、一次课程。


今天市面上很多数字分身,主要是在复刻一个人的语气、口头禅、表达风格。


但这类产品往往有一个问题:看起来像,想起来不像。能模仿语言,不能复刻思维。能回答知识点,不能还原专家做判断时的底层逻辑。


SoulAgent要做的专家分身,不只是「像某位专家一样说话」,而是尽可能逼近专家的思考方式。


它会围绕多个维度进行建模:核心价值观、推理路径、直觉判断、表达风格、专业知识图谱、认知安全边界。


换句话说,它不只是学习专家讲过什么,而是学习专家为什么这么判断、如何拆解问题、面对不确定性时怎样取舍。这也是专家分身真正区别于普通知识问答机器人的地方。


而这个核心能力的技术优势在于:第一,快慢双系统。让专家分身既有直觉,也会深思。


SoulAgent在专家分身中引入了类似人类认知的快慢双系统。


快思考,负责直觉判断。比如专家面对一个问题时,第一反应是什么,哪些方向会被快速排除,哪些风险会被本能识别。


慢思考,负责严谨推理。比如专家如何拆解问题,如何分层论证,如何权衡不同路径,如何形成最终判断。


这让专家分身不只是一个知识问答机器人,而是能够模拟专家判断路径、呈现专家思考框架的数字化大脑。用户可以问:「你会怎么看这个方向?」、「这个判断背后的依据是什么?」、「这个技术路线最大的风险在哪里?」


这类交互,才是专家分身真正有价值的地方。它不是给用户一个标准答案,而是让用户进入一个更高质量的思考过程。


第二,动态增量学习:专家成长,分身也要成长。


传统数字分身还有一个问题:训练完成后,其认知能力往往停留在训练时刻。


但真实专家的观点是会变化的。新的论文、新的技术、新的产业环境,都会不断改变一个人的判断。SoulAgent支持动态增量学习。


授权与可控更新机制下,它可以持续吸收专家最新演讲、论文、访谈和公开观点,更新知识边界和判断权重。专家本人持续成长,数字分身也同步进化。


这意味着,专家分身不是一个静态资料库,而是一个持续更新的认知体。


智源大会的实时听会,只是SoulAgent最容易被使用的第一个应用场景。


它真正的价值,不在于替用户完成一次信息获取,而在于成为连接认知与行动的新型智能基础设施。


面向个人,它可以持续沉淀来自会议、学习、工作和生活的信息,帮助用户构建不断成长的认知外脑。


面向科研,它能够承载顶尖学者的知识体系与思维方式,让宝贵的学术经验实现跨时间、跨地域的传承与协作。


面向产业,它可以汇聚多领域专家智慧,为企业、投资人和创业者提供高质量的判断支持与决策参考。


未来,每个人都可以拥有属于自己的第二大脑,每个领域都可以拥有持续进化的专家分身,每一次思考、学习和实践都能够被记录、沉淀和复用。


AI不再只是回答问题的工具,而将成为人类认知能力的延伸与放大器。


当然,一个真正面向个人长期使用的Agent,也必须建立清晰的安全边界。


长期记忆不是无限采集,专家分身不是无授权复刻,持续感知也不是无边界监听。


SoulAgent真正要建立的,不只是能力系统,更是一套用户可控、专家可授权、内容可追溯的可信机制。


用户应该知道AI记住了什么,也应该能够决定哪些信息被保留、哪些信息被删除、哪些场景可以被感知。


专家也应该拥有清晰的授权机制和表达边界,确保分身不是对个人观点的失控复制,而是在可控范围内进行知识传播和思维陪伴。


只有在信任成立之后,SoulAgent才可能真正成为长期伙伴。


现在,SoulAgent已经开放体验。


用户可以在微信小程序中搜索SoulAgent,也可以通过Web端登录:


https://soulagent.world/home


从第一次对话开始,建立一个越用越懂你的专属智能体。


参考资料:


https://soulagent.world/home



文章来自于微信公众号 “新智元”,作者 “新智元”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

6
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales