今年 6 月,The Browser Company 向 Arc 用户开放了浏览器 Dia 的 Beta 测试。上个月,Perplexity 新推出了自己的 AI 原生浏览器 Comet,随后 OpenAI 也宣布计划在未来几周发布浏览器。而就在这周,Perplexity 更是向 Google 母公司 Alphabet 提出以 345 亿美元收购 Chrome 的邀约,这一出价甚至超过了 Perplexity 自身最新 200 亿美元的目标估值。
在 AI 时代,浏览器到底能带来怎样的变革?为什么 Perplexity、OpenAI 都争相布局这一赛道?
本文梳理了 Perplexity CEO Aravind Srinivas 对 AI 浏览器市场的最新观点,并整理了 a16z 对 Comet 与 Dia 等产品的测评:
• Comet 作为 AI 原生浏览器,解决了传统浏览器标签页过多、信息碎片化干扰用户思路,以及用户想法与行动脱节等问题, 将人与 AI 的交互核心从对话转向完整工作流的执行;
• 当前的 AI 本质上仍是工具,人们仍然使用传统的操作方式在不同的 AI 工具间切换、复制粘贴,而浏览器是 AI 真正成为私人助理的必要平台;
• Perplexity 当前最关注的核心指标是 Comet 浏览器的用户留存率,Aravind 认为如果 AI 的盈利仍依赖通过关键词投放广告,那 Google 将依靠自身几乎垄断的广告网络,始终占据优势;
• Aravind 认为,相比传统浏览器,AI 浏览器的根本优势是用户数据严格是保留在本地的,AI 浏览器可以按需使用用户数据来提供个性化服务;
• a16z 测评后认为,Comet 真正发挥出了 AI agent 的作用,而 Dia 更像是 ChatGPT 的替代品;
• 当前的 AI 普遍缺乏主动性,难以真正接管用户的工作流,而实现 AI 主动性的关键在于 Memory。
……
Comet 是 Perplexity 推出的 AI 原生浏览器
Comet 是一个由 Perplexity 推出的 AI 原生浏览器,把模型智能和浏览器结合,AI 既嵌入了搜索框,又可以作为 assistant 常驻在侧边栏,这解决了传统浏览器标签页过多、信息碎片化干扰用户思路,以及用户想法与行动脱节等问题,让用户的互联网浏览可以变得更像一场流畅的对话。
其中 AI assistant 是 Comet 的核心。用户在浏览网页时,可以随时召唤 Comet 的 assistant 来理解当前屏幕的 context,帮助填写信息或解答问题。同时,用户还能在标签页中让它去做复杂任务,比如用户可以要求:“帮我找到在某公司工作、拥有 5 年经验、毕业于斯坦福的工程师,将这些工程师的信息整理成表格并邮件发送给 Hassan。” Comet 会尝试自主完成这一系列操作。如果遇到困难,它会提示用户介入来完成任务。
Comet 的目标是成为用户在数字生活中的智能助手。Perplexity 希望 Comet 获取信息的速度能够像人类思考一样自然且无延迟,只有这样,才能让 AI 真正无缝融入用户的数字生活中。
目前 Perplexity Max 订阅用户已经可以使用 Comet。此外,Comet 的 waiting list 上仍有超过 50 万人,invite-only 的访问权限会在今年夏天逐步向 waiting list 上的用户推送。Perplexity 计划先服务好早期用户,之后再将 Comet 全量推向市场。
Comet 是 Perplexity 推出的 AI 原生浏览器
在模型上,Comet 使用 OpenAI、Anthropic 以及 Perplexity 自身基于 DeepSeek 模型训练的自研模型,用户可以直接在 Comet 中调用 ChatGPT 等外部 AI 工具。为了确保模型在真实场景中的表现,Perplexity 采用了一套严谨的模型选择与优化流程:
1. 模型选择:基于真实场景的 PPLX Bench 基准
Perplexity 内部维护着一个不断扩展的基准测试集 PPLX Bench,这个测试集收集了大量来自 X、Discord、Reddit 等产品真实用户反馈的 prompt 和典型用例。新模型必须在这个基准上表现优异,才会被 Perplexity 考虑集成到 Comet 中。相比仅依赖学术基准,这种基于真实用户数据的评估方式更能反映实际产品需求,也更难被模型厂商针对性地优化或过拟合。
2. 模型训练:深度优化以适应产品需求
对于自研模型,Perplexity 采用了一套高度定制化的 post-training 流程,关键在于动态构建训练数据。Perplexity 会从 PPLX Bench 评测和线上实际服务中,挑选出当前模型表现不佳的 prompt,并与保持模型通用能力所需的 prompt 结合,组成训练集。随后,通过监督微调(SFT)和基于人类反馈的强化学习(RLHF)对模型进行深度优化,其中 RLHF 阶段使用的是 DeepSeek 设计的 GRPO 算法。整个流程的目的是希望能够显著提升模型在处理对 Perplexity 产品体验至关重要的特定类型查询上的表现,使 Perplexity 能更契合实际应用场景。
Perplexity 最关注 Comet 用户留存率
尽管 OpenAI 在 Comet 发布当天也宣布将开发 AI 浏览器,但 Aravind 认为 Perplexity 的决策核心始终专注于自身的服务能力和基础设施需求,而非竞争对手的动作。Comet 是 Perplexity 在七个月前就启动的长期项目,Perplexity 会在接下来几个月大幅扩展用户规模。
2025 年 7 月,OpenAI 宣布计划在未来几周内发布浏览器。与 Comet、Dia 类似,OpenAI 的浏览器将利用 AI 重新思考用户浏览网页的方式,而且会将部分用户交互保留在 ChatGPT 内部。此外,这个浏览器还可能会与 Operator 集成。
OpenAI 宣布即将发布 AI 浏览器
Perplexity 当前最关注的核心指标是 Comet 浏览器的用户留存率,并希望大多数用户能将 Comet 设为默认浏览器。Perplexity 认为,由于 Comet 默认使用 Perplexity 引擎,一旦达成这一目标,自然搜索和 agent 查询的日请求量将显著提升,未来可能需要重建搜索 infra 来支撑更大的用户规模。
用户将为能完成任务的 Agent 付费
Comet 的每次 agent 查询都包含大量子查询和多次模型调用,计算资源消耗极高,因此很难长期保持完全免费。为覆盖更广泛的用户群体,Perplexity 正在设计分层收费的商业模式:
• 免费计划:面向只需基础功能、将 Comet 作为简单浏览器替代的普通用户,提供非 AI 功能以及本地运行的基础 AI 能力,例如网页摘要等。
• 付费计划:适用于高生产力和高价值场景,例如访问并深度处理个人私有数据(如查询日程、邮件内容)或执行复杂分析(如分析用户的网络行为模式)等 agent 任务。
Perplexity 对广告驱动的商业模式兴趣不大。Perplexity 认为,如果 AI 产品的收入仍依赖通过关键词广告,那 Google 依靠自身几乎垄断的广告网络,将始终占据优势。
目前,Perplexity 正在尝试一种新模式:用户可以像雇佣高效员工一样,为完成任务的 agent 付费。这种模式的吸引力在于省时、高效、能带来实际价值,这也是用户对 Perplexity 和 Comet 感兴趣的原因。用户能明显感受到自己花的钱是值得的。比如,有用户反馈说:“Comet 用 5 分钟完成了我原本需要 2–3 小时才能完成的工作,还帮我省了 200 美元。”这些反馈说明了用户更愿意为能省时间、创造明确价值的服务付费,而不是忍受广告。从经济角度看,用户付的月订阅费,比自己花时间完成同样任务的成本低得多。
Comet 可以执行完整工作流
Aravind 认为,如果用户想真正用好 Comet 这款产品,仍然需要大量时间来适应和学习,最重要的就是要理解人与 AI 交互方式的转变:用户只需向 AI 下达任务指令,然后就可以等待 AI 执行完毕并交付结果。这与人们熟悉的、要求聊天机器人即时响应的交互方式有明显差异。
这种交互方式表明 Comet 已经将人与 AI 的交互核心从对话转向完整执行工作流,因此 Comet 有机会成为一个真正的 AI 操作系统,真正做到理解用户、控制浏览器标签、访问 API 与工具、依据用户意图智能决策,并可靠执行任务:
• 在生活中,用户可以用 Comet 来控制家庭设备,追踪物流包裹,批量清理邮件订阅,创建个性化新闻或股票工作流,根据天气自动调节灯光等;
• 在企业场景中,Comet 可以用来在 Facebook Marketplace 比价、确定商品定价、撰写社交媒体品牌调研文案等。
用户痛点在于当前的 AI 只是工具
Aravind 认为,过去 30 年里,浏览器已经从单纯的“浏览”和“搜索”工具,发展为人们生活、工作的重要平台。但自 2008 年 Chrome 推出以来,虽然浏览器在速度、内存等性能方面有所提升,并引入了每个标签页能作为独立进程运行的机制,但核心功能并没有出现根本性的创新,用户仍然需要投入大量时间来处理日常事务,比如需要逐个访问网站、手动点击链接、跨网站复制粘贴等。
如今,人们仍然需要在不同的 AI 工具间切换、复制粘贴,因为当前的 AI 本质上仍是工具。如果我们想要推动 AI 向更高层级进化,就需要有一种更高效的 AI 交互方式,来实现工作流自动化。即使未来出现 AGI 级别的模型,这种高效的 AI 交互方式仍然是必要的,因为这意味着 AI 能随时访问用户的完整 context,代表用户执行操作,并将工作成果与活动记录存储在服务器上。
而浏览器恰好提供了一个理想的平台。因为许多日常工作流程恰好是在浏览器中进行的,这促使 Perplexity 思考:如果从零重新设计浏览器,让它突破传统形态,变成一个能承载用户所有思考与工作的、如同瑞士军刀般多功能的“认知操作系统”,会是怎样的体验?而 Comet 正是在这样的背景下诞生的。
浏览器是个性化 Agent 的 OS
Aravind 认为,如果脱离浏览器环境,要构建真正实用的 agent 是非常困难的,因为 agent 必须以后台无界面模式运行,或者以带前端界面的有界面模式存在。
在浏览器自动化领域,无界面(Headless)模式指的是 agent 在后台运行而不显示界面,有界面(Headed)模式则包含可见的浏览器窗口。
在 AI 对用户进行实时、直接辅助的场景中,有界面模式具有显著优势:它可以无缝融入用户现有工作流,直接利用用户已登录的浏览器进行操作,避免了繁琐的重新认证或模拟登录。同时,浏览器本身经过长期验证,具有被大众广泛理解的安全机制和开源特性,这也提供了可靠、透明的安全保障。
而且,这种方式的最大优势在于零学习成本。浏览器本就是用户上网的核心入口和默认工作环境,而有界面模式无需用户适应全新的“AI 浏览器”概念或界面,用户依然使用熟悉的前端体验,只是这个工具变得更智能了,能在用户最习惯的环境里悄然提升浏览与操作效率,实现的是智能增强,而非对现有体验的颠覆。
比如 Aravind 表示,在浏览器中,如果用户想让 AI 代发 Slack 消息,无需配置本地 MCP 客户端或远程服务器,也不用费力打开桌面应用。只要在已登录的浏览器标签页中打开 Slack,AI 就能直接读取未读消息并生成摘要,按指令回复特定人员,或简单地将用户状态标记为离线。对于更复杂的任务,比如有人在线报告 bug 或反馈产品问题,用户想分派给合适人员并创建 Linear 工单,agent 也同样能够处理。
因此,AI 成为每个人真正的私人助理这一愿景,只有依托浏览器平台才能实现。
在理想的情况下,用户可以通过移动浏览器的语音模式召唤 agent,在用户口述指令后,agent 就可以自动完成任务。但前提是 agent 必须能够可靠工作,这依赖两大关键组件:
1)有强大的模型作为可靠的推理引擎;
2)有高效的编排,模型可以结合 context 与可用工具,来接管工作、代表用户行动、在需要时澄清问题并最终执行任务。
其中,Aravind 认为,编排的挑战远大于模型本身。如果人类能成功解决编排问题并实现跨平台运行,AI 的作用将突破 chatbot 的范畴,因为聊天只是交互方式,而浏览器才是承载真实工作流自动化的核心平台。只有当 AI 能真正分担人们日常工作的部分任务时,它才可能实质性地推动 GDP 增长。浏览器不仅是实现这一目标的有力条件,甚至很可能是必不可少的前提。
Aravind 认为,相比传统浏览器,AI 浏览器的根本优势在于用户数据是严格保留在本地的,Comet 等 AI 浏览器的服务端无法访问这些数据。这与传统桌面应用依赖类似 MCP 的远程服务器连接用户数据的模式截然不同。如果用户通过 OAuth 授权让远程 MCP 服务器连接 AI 客户端,那么对数据的安全与可控性将远不如在浏览器模式下。
因为在浏览器环境中,所有数据都是保存在用户设备上的,Perplexity 没有建立任何访问用户第三方数据(如邮件、日历)的服务器。只有在 AI 需要调用特定工具来响应用户 Prompt 时,这些数据才会在本地按需使用。比如,当用户要求 AI 总结所有未读的 Slack 消息时,AI 会利用浏览器中已登录的 Slack 标签页读取信息并生成摘要,就和人类用户的操作流程一样,但 AI 无权完全访问用户 Slack 账户或获取密码。因此用户会拥有对数据完全的掌控权,比如用户可以在 prompt 中要求不使用个人数据。
但 Comet 作为“不仅能展示互联网,更能替用户使用互联网”的浏览器,需要用户授予一定的权限才能实现最佳效果。对大多数用户来说,选择使用 Comet 的关键在于相信自己的数据会被保护,Perplexity 需要让用户明白“授权越多,产品越有用”,从而打消对授权的顾虑。
除此之外,Comet 还提供网页摘要、YouTube 和 LinkedIn 搜索辅助等不依赖个人数据的 AI 功能。这些与隐私无关的功能同样能够简化工作流程,因为用户不再需要在不同标签页或应用间频繁切换、复制粘贴,比如用户可以直接在 Comet 中调用 ChatGPT 来处理当前页面内容,而不需要从网页上复制内容,然后粘贴到 ChatGPT 上让 AI 修改,再把 ChatGPT 的输出粘贴回 Google 文档或 Gmail。
Aravind 认为,这种设计不仅延续了 Perplexity 的理念,也将 Comet 应用场景从单纯搜索拓展到更广泛的交互领域,而且还实现了一个平衡:AI 可以按需使用用户数据来提供个性化服务,但绝不收集数据用于模型训练或出售给广告商。Perplexity 将这种设计描述为“架构上的灵活性”。
在 Perplexity 发布 Comet 之前,The Browser Company 早在 6 月就对 Arc 用户开放了 AI 原生浏览器 Dia 的 Beta 测试。目前 Dia 和 Comet 都没有全量推出,如果用户想要使用 Dia,需要拥有 Arc 浏览器账户,或者加入 waiting list。如果用户想要使用 Comet,需要邀请码或是成为 Perplexity Max 订阅用户。
Dia 浏览器
a16z 近期也对 Dia 和 Comet 做了详细的产品测评:
两款浏览器的优势(TIE 表示双方在该维度的表现打平)
功能相似点
不同于需要用户跳转到独立界面才能启动任务的 agent 产品(比如 ChatGPT 的 Operator 或 Google 的 Project Mariner),Comet 和 Dia 都将 AI 能力无缝融入到了用户的日常操作中,实现了实时协同。
• 相似 1:侧边弹出 AI 聊天助手
这两个浏览器的共同功能是都有一个侧边栏 AI assistant,这个 assistant 能基于当前页面内容、用户高亮或截图部分进行提问、处理任务或写作。比如,用户无需复制链接到 ChatGPT,ChatGPT 就可以总结视频或文章;AI 也可以在用户购物时在当前页面直接查找平价替代品。这种交互方式比手动把内容输入 ChatGPT 或 Claude 更加自然流畅,能显著提升了用户日常使用 AI 的频率。
两款浏览器都具备强大的 AI Assistant 功能
• 相似 2:语音模式和个性化设置
这两个浏览器都支持语音模式,用户可以通过语音发送指令,而且都提供个性化功能,比如 Dia 允许用户在操作中设置编程默认语言、格式之类的个人偏好。
Comet 的优势
• 相比 Dia,Comet 在搜索和摘要能力上表现更出色
在产品测评中,a16z 认为由于基础搜索和摘要总结是 Perplexity 的核心业务,Comet 也继承了这一优势。在多轮使用相同搜索词的浏览器对比测试中,Comet 在信息呈现的格式和引用来源的清晰度方面都优于 Dia。对于更复杂或更深入的搜索需求,用户可以直接使用 Perplexity 的 Deep Research 功能进行深度挖掘,而无需编写非常复杂的 prompt。
Comet 在搜索和摘要呈现上更清晰
• Comet 在实际操作任务方面表现更突出
用户可以授权 Comet 接入 Google 日历、Google Drive、Dropbox、WhatsApp 等服务。完成授权后,用户不仅可以跨这些应用、浏览器历史和 Perplexity 历史进行统一搜索,还能直接在 Comet 界面向这些应用下达任务。用户还可以在 Comet 中设置周期性任务。
在 a16z 的测评中,Comet 具体使用场景包括:
1. 信息提取:从旧邮件或会议记录中提取关键信息,比如航班信息、确认码、会员号;
2. 收件箱管理:智能高亮出最重要的未读邮件;
3. 账单处理:查找未付账单并指引支付入口;
4. 日历管理:查询上次一对一会议时间、安排新会议并发送邮件通知。
这些操作都可以通过 Comet 在 30 秒内直接完成。
还有一个更能体现 Comet 价值的用例是:当用户让 Comet 查找并购买一本适合 5 岁孩子的生日礼物书时,Comet 内置的购物功能就能立即派上用场。如果用户已预先保存账单和收货信息,Comet 可以一键完成购买。相比之下,Operator 等通用型 agent 目前还做不到这一点,每次都需要用户重新输入付款信息,使用体验相对繁琐。
a16z 认为,借助浏览器这一形态,Comet 能在任务完成后直接推送结果,而不必让用户在特定时间主动打开 Perplexity。这也正是拥有一个浏览器给 Perplexity 带来的好处,也解释了为什么很多用户很少使用 ChatGPT 的 Task 功能,毕竟用户并不会一直停留在 ChatGPT 的界面中。
Comet 在完成用户的任务后直接推送结果
• 在协作功能上,Comet 的表现比 Dia 更好
Comet 浏览器内置的 Spaces 功能支持长期项目管理,并允许用户与他人共享、协作,这个功能相当于一个带有搜索功能的 Google 文件夹。用户还可以通过模板快速启动项目,例如规划旅行,只需经过个性化调整后就可以与协作者共享并共同推进项目进程。
Comet 能将搜索结果与他人分享
Dia 的优势
Dia 的亮点在于 Skill 功能与多标签页协同。a16z 认为用户在使用 Dia 时,更倾向于进行工作流管理,把它当作 ChatGPT 的替代品,而不是传统浏览器的替代。Dia 的设计也体现了这一定位,比如它的顶部甚至没有传统导航栏,用户需要通过聊天界面来搜索或访问网站。在 Dia 中,用户还可以根据自己的身份、职业或语言风格个性化设置浏览器,并创建可一键触发的自定义 Skill 或任务。
Dia 的 Skill 功能允许用户编写简短代码,作为各种设置的快捷方式。例如,用户可以让浏览器生成一个更适合阅读的页面布局,系统会自动编写相应代码,从而更好地满足用户个性化的需求。
在 a16z 看来,虽然从浏览器功能角度来说,Comet 优于 Dia,但仍有用户会为了用自己设置好的一些 Skill,每天都用 Dia,因此如果用户愿意在初始设置上投入精力,Dia 会是一个非常强大的产品。
比如,当一位内容创作者想要联系一批品牌方时,可以这样与 Dia 协同工作:
1. 创建一个“联系邮件”的 Skill 模板,并在需要 Dia 调研的部分预留出空位。
2. 遇到目标品牌时,给 Dia 提供网址,或直接在品牌网站上启动 Dia。
3. 提供创作者的个人信息及受众数据。
4. Dia 会自动调研这个品牌和团队,并生成个性化的联系邮件。
Dia 的 Skill 功能与多标签页协同
此外,Dia 在处理共享 context 的多标签页场景上的表现尤为出色。对于习惯同时打开大量关联标签页的用户来说,Dia 的界面非常高效,而且 Dia 还支持上传文件作为附加背景。比如,用户可以同时打开十篇关于同一研究主题的文章,让 Dia 汇总内容;或者打开五个 Airbnb 选项,让 Dia 扫描所有标签页并生成核心要素对比表。a16z 认为,虽然 Perplexity 也支持对特定标签页的查询,但 Dia 的操作更加便利。
Dia 擅长处理共享 context 的多标签页场景
能完成简单工作流的 Agent 会在明年初更加普及
未来,AI 将改变人们获取和消费信息的方式,因为 AI 会以更原生的方式集成到浏览器等各种工具中,用户不再需要在独立标签页中打开 ChatGPT 或 Perplexity 这类应用,而是能够在搜索栏、侧边栏,甚至任意访问的网页上直接调用 AI。
因此,AI 如何和工作流集成将是关键环节,而 agent 在其中将发挥重要作用,Aravind 预计,今年将会出现越来越多可构建简单工作流的 agent,这类 agent 会在明年初得到更广泛的普及。
Aravind 认为,对普通消费者来说,未来两三年最大的变化是能够直接让更强大的 agent 做复杂的研究任务。比如,“研究这家公司并推荐潜在人选”,或“找出 SpaceX 最早的五名工程师以及他们的背景”。这类任务的难点在于信息分散、缺乏现成记录。
而更深层次的变革将发生在个人效率与健康管理上。如果 AI 能访问用户的浏览历史等数据,那它就不仅可以精准分析时间使用情况,比如指出用户上个月在哪些网站花费过多时间,还能根据自然语言指令直接采取行动,比如用户可以要求 AI 在自己在某网站停留超过 15 分钟时发出提醒。相比现有的屏幕时间管理工具,未来的体验将是高度整合、自然语言驱动的,使 AI 真正成为私人助理,也就是说 AI 既能做总结信息、提醒遗漏、过滤邮件等工作事务,也能处理生活琐事。
Memory 是解锁主动型 AI 的关键
“记忆”(Memory)是今年 AI 领域的热点议题,但业界对实现路径存在分歧:部分人认为记忆问题应该在应用层解决,也就是通过 Perplexity、Gemini、ChatGPT 等应用来实现;也有部分人认为这个问题应在操作系统层解决,比如将数据直接存储在 macOS 或 iOS 中。
Aravind 认为,因为移动端原生应用的一些活动是浏览器无法获取的,所以从覆盖范围来看,操作系统层面的方案是最为完整的,但浏览器依然是存储“记忆”的最佳选择之一,仅次于 iOS 或 Android 等操作系统。
因为用户在桌面和手机上的大部分活动都能通过浏览器访问,浏览器的覆盖范围是远超聊天应用的,后者只能获取用户主动输入的信息,如“我想要这个”“我今天感觉如何”或“帮我写篇文章”,并据此推测用户的行业、大致年龄和兴趣等,形成相对粗糙的用户画像。但用户真正需要的,是 AI 能深入了解他们如何工作、要想什么,并能真正接管工作流,自动化大量事务,甚至在需求出现之前就主动提供帮助。
而浏览器不仅用户基数庞大、使用场景无处不在,还是预测并满足用户需求的理想载体。比如在购物网站上,AI 可以屏蔽广告等无关内容,并按照用户偏好高亮重要信息。这相当于在用户层构建了一个生产力引擎。这也是 Larry Page 对 Google AI 的终极愿景:在用户提问前就已经知道了用户所需。如果这一能力能在特定的高价值场景中落地,那就有潜力打造出类似下一代 iPhone 级别的革命性产品。
Google 创始人 Larry Page 对 Google AI 的终极远景
目前 AI 无法达到这种效果的主要原因在于当前的 AI 都缺乏主动性。而让 AI 变得主动的关键就是记忆,记忆是解锁主动智能的核心。
文章来自于微信公众号“海外独角兽”,作者是“Haozhen、lvy”。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0