百度发布文心一言正式发布不久后的4月,很多人还在感叹文心一言生成的图片多欢乐,更多人在为ChatGPT、Midjourney各种培训而疯狂的时候,Meta创始人兼CEO扎克伯格正在想着如何“以有用且有意义的方式”向全球数十亿人介绍AI Agents的机会。
OpenAI完成新一轮3亿美元融资的5月,创始人Sam Altman私下对一些开发者说希望将ChatGPT打造成个人工作助手,知情人士透露的消息则是OpenAI一直在关注如何使用聊天机器人来创建自主AI Agents,相关功能很有可能部署在ChatGPT助手中。
6月的一次全体员工会议上,扎克伯格宣布了一系列处于不同开发阶段的技术,其中一个就是将带来具有不同个性和能力的AI Agents为用户提供帮助或娱乐。
在国内,虽然AutoGPT早在4月份就与国外同步火了,但限于大部分人对其背后的AI Agent缺少了解,开始的反响并不是太热烈。
直到7月初OpenAI应用人工智能研究负责人Lilian Weng那篇关于AI Agent的博文刷爆AI圈后,媒体圈、学研界、投资领域才真正开始热烈讨论AI Agent。
由此国内真正开启了探索与研究AI Agent的热潮,并且也有一些厂商开始以AI Agent模式重构产品架构与商业模式。
随着AI Agent原理、模式以及构建方式越发明朗,很多受困于技术、模式、生态乃至政策的创业者都是眼前一亮。
AI Agent不仅让大家看到了大语言模型(LLM,Large language Model)落地的方向,让更多创业者进一步燃起了LLM创业的希望,也让广大企业看到了高效应用LLM的未来趋势。
对于AI Agent创业,OpenAI的联合创始人Andrej Karpathy认为,普通人、创业者和极客在构建Agents方面比OpenAI更有优势,大家处于平等竞争的状态。
而大公司一边,面对大型科技公司和创业公司都有可能抓住这次Agent的机会,比尔盖茨也表示如果微软没有介入他会感到失望。
在科技巨头强劲推动、创业者快速拥抱以及大企业的积极引入下,AI Agent彻底火爆了。并且与之前LLM缺乏落地的境况不同,这次AI Agent再也不是纸上谈兵,目前已经有很多公司推出了Agent项目及相关产品。
有业内人士透露,至少有100+项目正致力于将AI智能体商业化,近10万名开发人员正在构建自主Agent。在这些AI Agents中,既有国外主要基于GPT与开源Agent框架构建的Agent项目,也有国内基于国产大模型(自研领域大模型)+开源架构的Agent产品。
说了那么多,都有哪些公司推出了Agent产品?目前的AI Agent产品又是什么形态?本文王吉频道盘点了全球六十个AI Agent,以让大家更好地了解AI智能体。
PS:因本文盘点的Agent项目众多,故而字数也达到了1W+,建议大家先收藏再阅读。
从AI Agent说起
虽然LLM具备了足够的智慧,但想要让它给出精确答案,还需要输入足够精准的prompt。一个掌握prompt的人和一个普通人使用同一个大模型提问问题,得到的答案会有很大区别:前者可以用多种技巧得到想要的结果,而后者就只能望LLM兴叹了。
想要用好LLM,就得先学会使用prompt,这个需求已经催生出一个不小的培训市场。prompt提示工程,在增加LLM使用难度的同时,也使得用户体验有所降低。本来应该尽显自然语言优势的LLM,反而因为繁杂的prompt而变得对普通用户不是那么友好。
这样,提示工程也就成了横亘在普通人与大模型之间的一座大山。
如何更好地解决这个问题呢?答案正是AI Agent(国内称作AI智能体)。
AI Agent是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的AI,AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。
而在LLM到来之后,AI Agent就被定义为基于LLM驱动的Agent实现对通用问题的自动化处理。
我们知道,LLM主要擅长处理和生成文本。它们可以回答问题、写文章、生成创意内容、帮助编程等。但LLM还是一个被动的工具,只在你给它输入时才会产生输出。
AI Agent提供了更广泛的功能,特别是在与环境的交互、主动决策和执行各种任务方面。可以说,AI Agent是真正释放LLM潜能的关键,它能为LLM核心提供强大的行动能力。
AI Agent和大模型的主要区别在于:大模型与人类之间的交互是基于prompt实现的。用户prompt是否清晰明确会影响大模型回答的效果,没有精确有效的prompt,即便是能力最强的ChatGPT也不行。
AI Agent 的工作仅需给定一个目标,就能够针对目标独立思考并做出行动,它会根据给定任务详细拆解出每一步的计划步骤,依靠来自外界的反馈和自主思考,为自己创建 prompt以实现目标。
比如让ChatGPT买一杯咖啡,ChatGPT给出的反馈一般类似“无法购买咖啡,它只是一个文字AI助手”之类的回答。
但你要告知基于ChatGPT的AI Agent工具让它买一杯咖啡,它会首先拆解如何才能为你购买一杯咖啡并拟定代用某APP下单以及支付等若干步骤,然后按照这些步骤调用APP选择外卖,再调用支付程序下单支付,过程无需人类去指定每一步操作。
虽然AI工具和Agent都是旨在自动化任务的软件程序,但特定的关键特征将AI智能体区分为更复杂的AI 软件。
当AI工具具有以下特征时,就可以将该工具视为AI Agent:
自治(Autonomy):AI 虚拟智能体能够独立执行任务,而无需人工干预或输入。
知觉(Perception):智能体功能通过各种传感器(如摄像头或麦克风)感知和解释它们所处的环境。
反应(Reactivity):AI 智能体可以评估环境并做出相应的响应以实现其目标。
推理和决策(Reasoning and decision-making):AI 智能体是智能工具,可以分析数据并做出决策以实现目标。他们使用推理技术和算法来处理信息并采取适当的行动。
学习(Learning):他们可以通过机器、深度和强化学习元素和技术来学习和提高他们的表现。
通信(Communication):AI 智能体可以使用不同的方法与其他智能体或人类进行通信,例如理解和响应自然语言、识别语音以及通过文本交换消息。
以目标为导向(Goal-oriented):它们旨在实现特定目标,这些目标可以通过与环境的交互来预定义或学习。
在类别上,AI智能体分目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。
自主智能体如Auto-GPT,能够根据人们通过自然语言提出的需求,自动执行任务并实现预期结果。在这种合作模式下,自主智能体主要是为人类服务,更像是一个高效的工具。
生成智能体,如斯坦福和谷歌的研究者共同创建的西部世界小镇或者《西部世界》中的人形机器人,它们在同一环境中生活,拥有自己的记忆和目标,不仅与人类交往,还会与其他机器人互动。
关于AI智能体,最近复旦大学自然语言处理团队(FudanNLP)推出的86页LLM-based Agents 综述论文,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-based Agent 的背景、构成、应用场景、以及备受关注的代理社会。
(PS:感兴趣的朋友,可以在后台发消息 agent ,获取该论文,照例王吉伟频道为大家准备了机翻版。)
说了这么多,很多朋友可能仍对AI智能体没有直观的感受。不要着急,下文我们将通过一个对比案例来加深大家的认知。
Ai 智能体渗透各领域
AiAgent.app是一个Web 应用,它允许用户创建自定义AI智能体以执行特定任务并实现目标。
下面王吉伟频道将通过使用Ai智能体与直接使用LLM的对比体验,看看AI智能体的优势。
比如想了解过去一个月AI行业的新闻和趋势,在Claude输入:过去一个月人工智能行业最新新闻和趋势的摘要。
所得到的结果,如下图:
可以看到,Claude只是列出了几条与AI相关的新闻资讯摘要。
而在AiAgent.app输入这段话,它首先会将你的需求分解成十项任务,然后通过提示与用户交互完成每一项任务,并为每项任务输出结果。显然,在AiAgent.app得到的关于近期AI行业的内容,要比在直接使用其他LLM获得的内容更加全面。
直接使用大模型能够获取这些内容吗?理论上通过输入更多的Prompt也能完成,但至少需要输入十次,也不能保证所输入Prompt精确性,且有时甚至不知道想要获取什么信息。
而在AiAgent.app只需要输入一句话,它就分析出了你可能的需求并列出相对全面的内容目标,引导你去完成想要的东西,效率提升数倍。
两者对比下来,在内容获取的丰富度以及效率上,显然AI Agent更胜一筹。这种资讯内容类Agent对媒体从业者、行业分析师等职业具有非常大的价值,能够大大减少研究资料的获取时间。
现在已经出现了一些面向更精确用户群体及应用场景的此类Agent,比如哥伦比亚大学推出的GPT Researcher就是一个基于ChatGPT的面向研究人员的Agent,可以为用户创建各种研究报告以促进研究。
这个案例还只是内容的获取,事实上现在已经出现面向多个应用场景的Agent,足以调动更多软件应用乃至硬件设备完成各项任务。
比如有些人已经通过AutoGPT实现了订餐、订票、打车以及购物;斯坦福西部世界小镇里的25个AI Agent每天都在散步、约会、聊天、喝咖啡以及分享当天的新闻;谷歌Deepmind推出了利用机械臂自动执行各种工作的robotic agent;亚马逊也推出了Amazon Bedrock Agents用于自动分解企业AI应用开发任务;IBM Watson Health已经在很多医院帮助医生诊断、治疗和监测患者。
虽然Ai Agent火爆的时间还不算长,但一经出现就得到了众多领域诸多企业的拥戴。大语言模型的多模特能力加上如今更大的算力,让多年前就提出的Agent快速得到价值凸显,并以超强的渗透率在更多领域落地。
而随着MetaGPT等开源AI Agent的出现,更多技术供应商与创业团队引入Agent,更多组织认知并接受Agent,它必然会快速成为LLM的落地个领域的主要模式,助力千行百业更好的应用LLM。
全球60个AI Agent大盘点
上面案例中所提到的AiAgent.app,是近几个月来风头正盛的AI Agent代表性产品之一。包括这款AI智能体在内的国内外多个Agent,均可以在下面的项目盘点名单中看到。
为了让大家更好地了解目前已推出的AI Agent,王吉伟频道将这些AI Agent分为媒体报道、国内已推出、行业型、海外其他以及GitHub项目几类,以后还会逐步奖励项目库,将这些Agent分门别类编入不同类别。
本文所盘点的AI Agents,既包括AI Agents框架及工具,也包括基于一些开源框架打造的AGENT产品,同时大部分项目及产品都为自主智能体。
因为一些厂商比较低调并未对外宣传,本文盘点的AI Agent并不完全,所以也叫作AI AGENT不完全名单。欢迎更多厂商及创业者看到本文后与王吉伟频道联系,大家一起为AI AGENT生态的繁荣发展做一份贡献。
一、媒体报道的AI Agent
1、Auto-GPT
Auto GPT是Github上的一个免费开源项目,结合了GPT-4和GPT-3.5技术,通过API创建完整的项目。
与ChatGPT不同的是,用户不需要不断对AI提问以获得对应回答,在AutoGPT中只需为其提供一个AI名称、描述和五个目标,然后AutoGPT就可以自己完成项目。它可以读写文件、浏览网页、审查自己提示的结果,以及将其与所说的提示历史记录相结合。
Auto-GPT是GPT-4完全自主运行的首批示例之一,它突破了人工智能所能做的界限。
2、AgentGPT
AgentGPT允许您配置和部署自主AI智能体。只要为你的自定义AI命名并让它开始任何可以想象的目标,它就能通过思考要完成的任务、执行任务并从结果中学习来尝试实现目标。
3、Baby AGI
这是一个人工智能驱动的任务管理系统。该系统使用OpenAI和Pinecone API来创建、确定优先级和执行任务。通过分析先前任务的结果和预定义的目标来创建任务,并使用 OpenAI 的自然语言处理(NLP)和Chroma在上下文中存储和检索任务结果。
Baby AGI的吸引力在于它能够根据先前任务的结果自主解决任务并保持预定义的目标,还能有效地确定任务的优先级。
4、Jarvis (HuggingGPT)
由Microsoft开发的一种独特协作系统,可以使用多个AI模型来完成给定的任务,以ChatGPT充当任务控制者。该项目在GitHub上被称为JARVIS,现在可以在Huggingface(因此称为HuggingGPT)上试用,这个Agent与文本、图像、音频甚至视频配合得非常好。
其工作方式类似于OpenAI通过文本和图像展示GPT 4的多模态功能,但JARVIS 更进一步集成了用于图像、视频、音频等的各种开源 LLM,还可以连接到互联网并访问文件。例如,您可以输入来自网站的 URL 并询问相关问题。
5、Aiagent.app
Ai Agent是一个Web 应用,允许用户创建自定义AI智能体以执行特定任务并实现目标。AI 智能体的工作原理是将目标分解为较小的任务,并逐个完成它们。好处包括能够同时运行多个AI 智能体,并使对尖端技术的访问民主化。
AI Agent还拥有诸如具有语法突出显示的内联代码块,以及与第三方平台的无缝协作等功能。该工具是免费使用的,它提供了一种简化方法来构建AI智能体,无需更多技术知识。
6、Camel AGI
Camel AGI是一个生成式AI工具,使用户能够通过角色扮演自主AI智能体来解决给定的任务,当然用户需要启用Javascript以使用此工具。Camel AGI允许用户使用AI智能体完成任务,并提供使用Google登录或在Github上为该工具加星标的选项。
7、“Westworld” simulation西部世界小镇
这个项目来自斯坦福大学和谷歌的研究人员创建了一个交互式沙盒环境,其中包含25个可以模拟人类行为的生成AI智能体。他们在公园里散步,在咖啡馆喝咖啡,并与同事分享新闻,表现出令人惊讶的良好社交行为。
比如,从一个用户指定的一个概念开始,即一个智能体想要举办情人节派对,智能体在接下来的两天内自动传播派对邀请,结识新朋友,互相约对方约会派对,并协调在正确的时间一起出现在派对上。
8、GPT-Engineer
GPT-Engineer是一个开源AI工具,允许用户指定他们想要构建的内容,然后与AI进行澄清对话以生成所需的代码库。该工具旨在提供简单灵活的用户体验,允许用户根据自己的需要调整和扩展其功能。
该工具包括指定AI智能体的身份、存储与GPT4的通信历史记录以及重新运行消息日志等功能。欢迎对项目做出贡献,感兴趣的个人可以参考 GitHub 存储库上提供的路线图、项目和问题。GPT-Engineer旨在成为一个开放平台,供开发人员探索和构建其代码生成工具箱。
9、MetaGPT
MetaGPT是一个开源多智能体框架,采用单行输入来生成 API、用户故事、数据结构、竞争分析等。该框架可以充当产品经理、软件工程师和架构师。该框架可以充当整个软件公司,只需一行代码即可编排SOP。
MetaGPT与人类SOP流程设计集成。因此,基于LLM的智能体生成高质量,多样化,结构化的文档和设计。MetaGPT 的设计使为复杂任务设计解决方案变得容易,并提供几乎可以与人类智能相媲美的问题解决能力。
10、Amazon Bedrock Agents
亚马逊发布的Amazon Bedrock Agents,允许开发人员快速创建完全托管的智能体。通过对企业系统执行API调用,Amazon Bedrock智能体加快了可管理和执行活动的生成式AI应用程序的发布速度。
Amazon Bedrock Agents简化了用户请求任务的快速工程和编排。设置完成后,这些智能体可以自主构建提示,并使用公司特定的数据安全地增强提示,从而向用户提供自然语言响应。这些高级智能体具有推断自动处理用户请求的必要操作的能力。
11、nvidia Voyager
由NVIDIA、加州理工学院等共同推出的Voyager,使用GPT-4来引导学习的Minecraft智能体通过像素世界,需要说明的是,Voyager依赖于代码生成,而不是强化学习。
Voyager是第一个玩《我的世界》的终身学习智能体。与其他使用经典强化学习技术的 Minecraft智能体不同,Voyager使用GPT-4来不断改进自己,通过编写、改进和传输存储在外部技能库中的代码来实现这一点。
这会产生一些小程序,帮助导航、开门、挖掘资源、制作镐头或与僵尸作战。GPT-4解锁了一种新的范式,在此范式中“训练”是代码的执行,“训练模型”是Voyager迭代组装的技能代码库。
12、RoboAgent
Meta和CMU 联合研究团队耗时两年,成功开发出的RoboAgent 通用机器人智能体。RoboAgent仅仅通过7500个轨迹的训练就实现了12种不同的复杂技能,包括烘焙、拾取物品、上茶、清洁厨房等任务,并能在100种未知场景中泛化应用。
无论遇到多大的干扰,RoboAgent 都能坚持完成任务。该研究的目标是建立一个高效的机器人学习范例,解决数据集和场景多样性的挑战。研究人员提出了多任务动作分块 Transformer(MT-ACT)架构,通过语义增强和高效的策略表示来处理多模态多任务机器人数据集。
13、Inflection AI Pi
Inflection AI公司推出的个人AI Agent产品Pi,核心大脑是公司研发的Inflection-1大模型,性能媲美GPT-3.5。Pi与时下流行的通用聊天机器人不同,它只能进行友好的对话,提供简洁的建议,甚至只是倾听。
它的主要特征是富有同情心、谦虚好奇、幽默创新, 具有良好的情商,可以根据用户的独特兴趣和需求提供无限的知识与陪伴。Inflection自开发Pi开始,就确定了Pi将作为个人智能(Personal Intelligence),而不仅仅是辅助人工作的工具。
14、HyperWrite
Hyperwrite是一款AI写作智能体工具,可帮助任何级别的创意作家更快、更自信地写作。它包括自动写入和提前打字等功能,可生成原始段落并提出克服作家障碍的想法。
该工具作为免费的Chrome扩展程序提供,可以在任何网站上使用,而不会中断工作流程。它被世界各地的专业人士、学生和创作者使用和信任,以提高他们的生产力。
15、GPT Researcher
GPT Researcher是一个基于AI的自主智能体,用于对各种任务进行全面的在线研究。该工具受到AutoGPT和“计划和解决”提示的启发,旨在改进当前语言模型中发现的速度和确定性问题,“通过并行智能体工作提供更稳定的性能和更高的速度,而不是同步操作。
根据该团队的说法,GPT研究员通过生成相关的研究问题、汇总来自 20 多个网络资源的数据以及利用GPT3.5-turbo-16和GPT-4来创建全面的研究报告来促进研究。
国内已推出的AI Agent
经过持续探索与尝试,国内AI智能体相关的产品也开始崭露头角,下面介绍五款产品。
1、阿里云ModelScopeGPT
阿里云Mota社区推出的国内首个大型模型调用工具魔搭GPT(ModelScopeGPT),通过这一款工具,使用者们可以通过一键发送指令调用Mota社区中的其他人工智能模型,从而实现大大小小的模型共同协作,进而完成复杂的任务。
ModelScopeGPT基于开源大语言模型(LLM)的AI Agent(智能体)开发框架ModelScope-Agent。这是一个通用的、可定制的Agent框架,用于实际应用程序,其基于开源的大语言模型 (LLMs) 作为核心,包含记忆控制、工具使用等模块。
开源 LLM 主要负责任务规划、调度以及回复生成;记忆控制模块,主要包含知识检索以及 prompt (提示词)管理;工具使用模块,包含工具库以及工具检索和工具可定制化。
2、实在智能TARS-RPA-Agent
实在智能在超自动化领域首发的TARS-RPA-Agent,是一个基于“TARS+ISSUT(智能屏幕语义理解)”双模引擎、有“大脑”,更有“眼睛和手脚”的超自动化智能体,是能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA全新模式产品。
TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕语义理解为基座的技术框架。该技术框架分为两层结构:底层是包括通用基础模型和各个垂直行业基础模型在内的TARS系列大模型和智能屏幕语义理解技术;上层是依托这两项关键技术完成全面升级和改造的超自动化产品。
TARS-RPA-Agent的核心LLM是实在智能基于通用大模型基座的自研垂直“塔斯(TARS)”大模型,TARS大模型具备优异的文本生成、语言理解、知识问答、逻辑推理等主流能力。
3、OmBot欧姆智能体
2023 世界人工智能大会上,联汇科技发布了基于大模型能力的自主智能体(Auto AI Agent )——OmBot 欧姆智能体,并针对典型场景需求推出了首批应用。
联汇自主智能体包含了认知、记忆、思考、行动四大核心能力,作为一种自动、自主的智能体,它以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它不依赖人类来指导命令,具备高度可扩展性。
4、澜码科技Ask XBot
澜码科技构建的Agent平台“Ask XBot”,平台分两层:第一层是专家赋能,专家通过拖、拉、拽以及对话交互的方式定义工作流程,教给机器,从而协助一线员工构建更高效工作的方法论;第二层是员工使用Agent,一线员工可以通过自然语言和Agent沟通并下达指令,让Agent协助完成数据分析、资料调取等工作。
该公司计划将Ask XBo打造成一个兼具通用性和易用性的平台,把这些API和Agent做好管理,让Agent包装不同的API,不同模型的Agent能够在上面更好地协作,让它们可以在平台上更有效率、更智能地服务好客户。
5、ChatDev
由清华大学、北京邮电大学、布朗大学联合研究团队推出的ChatDev,是一个生成式智能体。它基于聊天的端到端软件开发框架,能够利用大型语言模型(LLMs)促进软件开发过程中多角色(ChatGPT 的 “gpt3.5-turbo-16k” 版本)之间的有效沟通和协作。
ChatDev的主要目的是通过聊天来进行游戏开发。用户只需提出想法,从设计到测试的整个流程都由AI完成,整个过程只需七分钟即可完成。
面向不同领域的AI Agent产品
LLM还没有出现之前,一些企业就已在研究传统AI与Agent的结合应用。因此,AI Agenmt在各领域的落地比大家预想得要快很多。
下面,是几个行业领域的代表性Agent应用。
在医疗领域,Agent可以帮助诊断、治疗和监测患者。IBM Watson Health 是一个AI智能体,可以分析医疗数据,以识别潜在的健康问题并推荐治疗方案。
在金融领域,Agent可以分析财务数据、检测欺诈行为并提出投资建议。嘉信理财(Charles Schwab)使用名为Intelligent Portfolio的人工智能智能体,根据客户的投资目标创建和管理投资组合。
在零售业务场景中,Agent可以提供个性化推荐,改善供应链管理,增强客户体验。亚马逊的Alexa是一个AI智能体,可以推荐产品,下订单和跟踪发货。
在制造业,Agent可以优化生产流程,预测维护需求,提高产品质量。通用电气使用名为Predix的AI智能体实时监控机器,以预测和防止设备故障。
在运输领域,自主AI Agent可以协助路线规划、交通管理和车辆安全。特斯拉的Autopilot有助于自动驾驶车辆,并帮助驾驶员停车、变道和安全驾驶。
在教育行业,Agnet可以提供个性化的学习体验,自动执行管理任务并分析学生的表现。培生(Pearson)的AI智能体Aida可以为学生提供反馈,并建议个性化的学习路径。
在农业领域,AI Agent可以优化作物生产、监测土壤质量并预测天气模式。约翰迪尔(John Deere)正在使用一种名为See&Spray的AI智能体来检测和定位杂草,而不会影响作物。
海外已推出其他AGENT产品
1、Cognosys
Cognosys是基于Web的AI智能体,旨在彻底改变生产力并简化复杂任务,使用最先进的 AI 技术提升您的日常生活。
2、Doanythingmachine
使用“无所不能”机器轻松管理您的任务,用户个人AI 智能体将为您确定优先级并完成您的任务
3、alphakit
用于创建和管理目标驱动型自主AI智能体团队的直观平台,全部通过手机创建和管理 autoGPT AI智能体团队。只需定义你的目标,Alphakit负责剩下的工作。
4、GPTConsole
GPTConsole是一个革命性的命令行界面(CLI),旨在为开发人员提供人工智能的优势。它超越了传统的终端功能,使用户能够使用提示执行复杂的任务。
5、Fini
提供指向知识库的链接,在2分钟内将您的知识库转换为AI聊天。Fini为用户提供一个不知疲倦的AI智能体,随时准备24/7立即回答客户问题。
6、Spell
Spell是一款基于GPT4自主AI智能体,可以应用于日常高效工作。Spell还具有急需的功能,可帮助您更智能地工作,并学习利用生成式AI 的强大功能,生成一个或多个创新的自主智能体,这些智能体将致力于解决您的问题。
7、Aomni
Aomni是一个信息检索AI智能体,能够为你查找、提取和处理互联网上的任何数据,增强你的研究工作。Aomni可以使用各种工具来智能地规划你的查询以获得最终结果,包括一个完整的 Web 浏览器,允许它访问互联网上的任何信息,而无需 API。
Aomni的查询规划器基于当前最先进的AutoGPT架构,智能地计划和更新每个请求,以确保来源的正确性和多样性。
8、Fine-Tuner.ai
借助Fine-Tuner.ai,用户可以构建复杂、量身定制的AI智能体,而无需技术技能或编码,只需输入你的数据和想法即可。十几个专业AI智能体通过上传的PDF、CV、PPT、URL 等即时数据,可为用户创建精确的问答、文档搜索、流程自动化等。
9、SuperAGI
一个开源的自主AI框架,使您能够快速可靠地开发和部署有用的自主智能体,用于构建、管理和运行自主智能体的基础结构。
10、Yellow.ai
Yellow.ai是领先的企业级对话式人工智能平台,可以为企业动态AI智能体提供支持,旨在通过其无代码/低代码平台提供类似人类的交互,从而提高客户满意度并提高员工敬业度。
11、Godmode
使用户能够在浏览器中运行AutoGPT。Godmode允许用户同时部署多个AI智能体以使用AI 完成任务,用户也可以使用自己的OpenAI API密钥。
12、E42
E42是一个认知流程自动化平台,企业可以使用该平台创建多功能认知智能体,以跨功能自动化各种流程。认知驱动的无代码平台与用户现有的技术和流程无缝集成,以释放跨部门的最高价值。用户可使用E42构建自己的AI智能体,比如AI分析师以及跨垂直行业的AI招聘人等。
13、Thankful
Thankful的AI智能体经过培训和量身定制,可在您现有的帮助台中工作,通过电子邮件,聊天,短信和应用内渠道轻松解决大量客户查询。凭借理解、连接、解决、个性化和通知的能力,ThankfulAI智能体以机器般的速度和天生可扩展的专业知识提供类似人类的服务体验。
14、Aktify
使用Aktify的虚拟AI智能体克隆您的销售团队,无需增加员工人数。Aktify将大规模处理无限数量的无响应潜在客户),并始终如一地将随时可以交谈的客户带到您的销售团队的门口,它不只一个短信聊天机器人。
15、TeamSmart AI
通过一键访问TeamSmart AI来提高您的工作效率。在浏览器中直接汇总内容、生成代码、起草推文等。单击图标或键盘快捷键即可立即打开ChatGPT,无需登录,即可即时访问质量提示库。
16、BrainstormGPT
BrainstormGPT集成了多个智能体、LLM和自动搜索,以简化主题到会议报告转换。自定义主题,用户定义的角色,智能体自主讨论,在 20 分钟内输出的报告,约等于300 次搜索、10 小时讨论和 100,000 次文本分析。
17、AgentRunner.Ai
AgentRunner.ai是一个自主AI 智能体创建工具,它利用 GPT-4的强大功能来创建和训练完全自主的智能体。允许用户为他们的智能体设定目标,并让他们决定如何实现这些目标,而无需任何技术知识或编程技能。
该工具提供的功能包括创建具有独特个性的自主智能体,运行智能体以执行任务或学习新技能,决定智能体可以做什么以及与OpenAI或Google Cloud帐户集成。
18、Gista
Gista可帮助企业与网站访问者互动并将其转化为24/7的潜在客户,其主要功能包括构建AI转换智能体和AI销售智能体。使用 Gista,企业可以轻松地将网站访问者转化为潜在客户并建立电子邮件列表。
19、Agent4
Agent4的主要功能之一是能够创建AI驱动的虚拟智能体,可以回答问题,帮助预订会议,收听语音邮件并提供摘要。
您可以轻松地为座席创建自定义交互,使他们能够用您品牌的声音回答问题并处理各种任务。您还可以选择座席如何实时响应呼叫,并决定是否以及何时需要与某人交谈。
20、Cometcore AI
Cometcore AI是一个创新平台,提供一系列多功能的AI驱动的工具,以提高生产力和沟通能力。使用Cometcore,您可以制作、编码和自动化可爱的智能体。
21、personal-assistant
一个人工智能代理,旨在处理从预订航班到进行深入研究以及介于两者之间的所有任务。
Github上的AI Agent项目
1、OpenAGI
OpenAGI是一个开源的AGI研究平台,专门设计用于提供复杂的多步骤任务,并附有特定于任务的数据集,评估指标和各种可扩展模型。OpenAGI将复杂的任务表述为自然语言查询,作为LLM的输入。LLM随后选择,合成和执行OpenAGI提供的模型来解决任务。
该项目还提出了任务反馈强化学习(RLTF)机制,该机制使用任务解决结果作为反馈来提高LLM的任务解决能力。LLM负责综合各种外部模型来解决复杂任务,而RLTF提供反馈以提高其任务解决能力,为自我改进的AI提供反馈循环。LLM操作各种专家模型来解决复杂任务的范式是AGI的一种有前途的方法。
2、Agent-LLM
Agent-LLM是一个人工智能自动化平台,旨在为跨多个提供商的高效AI指令管理提供动力。
该智能体配备了自适应内存,这种多功能解决方案提供了一个强大的插件系统,支持各种命令,包括网页浏览。随着对众多人工智能提供商和模型的支持不断增加,Agent-LLM不断发展以增强各种应用程序。
3、AutoGPT-Next-Web
该智能体可以实现一键式即在Vercel上部署精心设计的AutoGPT-Next-Web Web UI,一键免费部署你的私人AutoGPT-Next-Web 网页应用。基于AutoGPT-Next-Web,用户可在1 分钟内使用Vercel 免费一键部署,搭建个人的AutoGPT网站。
4、MiniGPT-4
这款Agent,可以使用高级大语言模型增强视觉语言理解。
5、Mini-AGI
Mini-AGI是基于GPT3.5/4的最小通用自主智能体。它结合了强大的提示,一组最少的工具和短期记忆(思想链),通过矢量存储的数据增强将很快添加,可以分析股票价格、执行网络安全测试、创作艺术品和订购披萨。
6、Teenage-AGI
此智能项目受几个与Auto-GPT相关的项目(主要是BabyAGI)和论文“生成智能体:人类行为的交互式模拟”的启发,这个Python项目使用OpenAI和Pinecone为AI智能体提供记忆,并允许它在采取行动(输出文本)之前“思考”。
7、FastGPT
FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景
8、DemoGPT
使用DemoGPT,只需使用简单句子即可快速创建演示。
9、LocalAGI
基于LLMDA、ChatGLM 等模型的本地运行AGI项目。
10、ai-town(游戏类)
著名投资机构a16z开源的AI小镇,一个MIT 许可的、可部署的入门工具包,用于构建和定制您自己的AI城镇版本。这是一个 AI 角色生活、聊天和社交的虚拟城镇。
11、gptrpg(游戏类)
gptrpg此存储库包含两件事:一个简单的类似RPG游戏的环境,用于支持 LLM 的 AI 智能体;连接到 OpenAI API 以存在于该环境中的简单 AI 智能体。
12、SFighterAI(游戏类)
该项目是一个使用深度强化学习训练的AI智能体,以击败游戏《街头霸王II:特别冠军版》中的最终BOSS。AI 智能体仅根据游戏屏幕的 RGB 像素值做出决策。在提供的保存状态下,智能体在最终关卡的第一轮中达到 100% 的胜率。
文章转载自微信公众号“王吉伟”,作者 王吉伟
【开源免费】ai-renamer是一个用AI帮你做文件夹或者图片命名的项目。该项目会根据文件夹或者图片内容来为文件进行重新命名,让你的文件管理更加便利。
项目地址:https://github.com/ozgrozer/ai-renamer
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】ai-town是MIT授权的一个AI虚拟小镇,该项目可以让研发人员轻松构建和定制你自己的AI小镇版本,其中居住在小镇的AI角色可以进行交流和社交。该项目受到研究论文《生成代理:人类行为的交互模拟》的启发。
项目地址:https://github.com/a16z-infra/ai-town
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0