重磅发布!“大模型+Agent” AI 原生应用来了!
依托强大的基座模型和创新研发的 AI Agents 技术,面壁智能正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台。
这是业内首次将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台产品,也是让软件开发者和创新创业者 以极低的成本和门槛高效完成软件开发工作 的开端。
ChatDev 申请试用地址:https://chatdev.modelbest.cn
与此同时,面壁智能也将其CPM系列基座模型升级为全新一代千亿参数大模型“面壁智能 CPM-Cricket ”,带来更强劲的逻辑推理和语言理解等能力,为“大模型+Agent”落地应用提供基础保障。
经权威测试,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2。在公考行测和 GMAT 试题的测试表现中,其核心能力与 GPT-4 相当。
不到两月星标超 1.6 万,屡次登顶 GitHub Trending,并创造出“用一杯可乐的时间和钱开发一款软件”的智能生产力神话,这是“ChatDev 智能体协作开发框架“自开源以来取得的耀眼成绩,持续引爆国内外软件开发和创业者社区的关注和热议。
在此期间,面壁智能产研团队快速响应构建面向用户实际需求的应用原型,首次提出并打造出基于“大模型+Agent”技术能力的应用平台,将 ChatDev 产品化,以 SaaS 服务的形式面向广大用户开放。
SaaS 版 ChatDev 将原始版本的核心能力浓缩成一个更加简洁高效、应用门槛更低的可视化交互平台,即便没有编程经验的普通用户,也能轻松使用。此外,面壁智能还对其流程进行了优化升级,正式发布版本将带来更高的运行效率。
只需三步走,即可实现软件开发革新:
第一步:
登录后,用户只需输入项目名称,进行简单设置,并通过“自定义链”定义公司中的角色、工作流程,就可以启动开发工作。
第二步:
在收到用户的软件需求指令后,ChatDev 中的智能体们就会根据各自的角色各司其事、统一协作,如同现实世界中软件公司工作情景真实上演。
第三步:
最快 3 分钟,ChatDev 就能生成可直接运行的应用程序。从“红包雨”这种颇受大众欢迎的营销神器,到“电子名片生成器”这类实用的商务工具,再到“五子棋”、“贪吃蛇”、“太空大战”等各种休闲小游戏……ChatDev 实现了“1 个人+多个 AI Agents”的革新软件开发模式。
ChatDev 软件开发平台究竟哪里好?
• 效率高:无需进行专业复杂的 prompt 探索,只需简单的需求说明就能后台自动完成整套工作流,让软件开发“降本提效”。
• 可共创:用户不仅可以通过上帝视角监督开发过程,还能直接和智能体 “人机共创”,让软件开发“一步到位”。
• 定制化:用户可根据个人喜好,增加、删除、调换、改变部分功能与设计,让软件开发实现“私人订制”。
SaaS 版本 ChatDev 的推出真正建立起大模型与应用的创新闭环,形成“数据飞轮”,促进平台功能持续迭代,推动 AI Agent 技术广泛应用。
大模型作为当今科技界“顶流”,如何改变生产方式、提高生产力,进而为社会经济带来真正价值,才是其迷人之处。
面壁智能希望以“大模型 + Agent”战略,布局大模型技术应用之路,不断打造高价值产品系列,驱动新一轮AI原生应用的爆发,迎接 AGI 时代的到来。
然而,应用的创新离不开基础模型能力的提升,面壁智能在基座模型方面也在持续攻坚,不断为产品和应用输送强劲的基础能力保障。
本次全新升级的 CPM-Cricket 是继 CPM-Ant、CPM-Bee 之后的第三代基座模型,在逻辑、代码、知识、指令理解等方面均有大幅提升。
根据在 HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH 等权威 LLM 评测集的结果,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面已全面超越 LLaMA2
伴随 CPM-Cricket 的推出,面壁智能基于 CPM 的多模态智能对话助手「面壁露卡Luca」也在快速成长,升级为 3.0 版本,其逻辑推理能力较首次发布提升了 163.9%,综合能力提升 61.5%。近期,Luca 也已正式面向公众开放服务。
为了测试模型的逻辑推理和语言理解在实践中的真实表现,面壁智能给 Luca 进行了公考行测能力测评。
结果显示,在包括常识判断、数量关系、资料分析、判断推理、语言理解与表达等多种题型的 425 道试题中,Luca 的总成绩表现优异,综合能力与 GPT-4 相当,在判断推理题目的正确率方面优于 GPT-4。
为了考察 Luca 的全面性,面壁智能还对其进行了英文的 GMAT 模拟测试。结果显示,Luca 在英文环境中的阅读理解和逻辑推理方面与 GPT-4 能力接近。
模型能力的提升取决于底层研发技术的综合实力。面壁智能探索出更为低成本、高效率的模型训练方法,让大模型不仅能 “训出来”,还能 “训得好”、“用起来”。
为此,面壁智能构建了一整套大模型创新研发体系,包括自研的高效训练框架、高效推理框架,大模型压缩工具,以及增量微调、指令微调、提示学习工具包等。此外,面壁智能还原创打造出大模型工具学习引擎,并已集成超过 16000 多个真实 API,可实现一键接入,调用工具解决更多复杂任务。不仅如此,面壁智能还部署了 Int8 量化模型,让模型推理成本降低 50%。
作为国内最早开展大模型研发的公司之一,面壁智能团队不仅早在 2020 年就发布了国内首个中文大语言模型 CPM-1,同时也是最早在 AI Agent 技术取得突破的大模型公司之一。今年 5 月,面壁智能就陆续推出并开源了 AI Agent “三驾马车”:AgentVerse、ChatDev、XAgent。
通过这些智能体的连接,我们会进入一个全新的 Internet of Agents(IoA) 时代。正如面壁智能的愿景“智周万物”,AI Agent 不仅能够创造新的交互方式,还将带来生产力的跃迁,为行业和用户带来更多想象空间,彻底改变人与人、人与物、物与物的万物交互方式。
ChatDev 产品版本的发布展现并验证了“大模型+Agent”赋能生产力提升和创新交互体验的清晰路径。然而其应用场景绝不局限于软件开发领域,它还可以是拟人的原生智能体,也可以是现实中的人和物的数字孪生智能体。
面壁智能联合创始人、CEO 李大海表示,“大模型+Agent”将会引起新一轮的应用爆发,为行业和用户带来更多新的能力与服务,推动 AI 大模型的场景落地。
目前,面壁智能大模型技术已为数百家企业提供商用服务,覆盖金融、商业、工业、医疗、教育、法律、媒体等多个行业和领域。未来,面壁智能将坚持通过领先的基础模型和高效易用的 Agent 技术与产品应用,打造清晰的 AI 大模型场景化落地路径,为千行百业的可持续发展打造源源不断的新价值高地。
文章来自微信公众号 “ 面壁智能 ”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0