面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

6776点击 2023-11-15 13:30

重磅发布！“大模型+Agent” AI 原生应用来了！

依托强大的基座模型和创新研发的 AI Agents 技术，面壁智能正式推出基于群体智能的AI原生应用——“面壁智能 ChatDev”智能软件开发平台。

这是业内首次将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台产品，也是让软件开发者和创新创业者 以极低的成本和门槛高效完成软件开发工作 的开端。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

ChatDev 申请试用地址：https://chatdev.modelbest.cn

与此同时，面壁智能也将其CPM系列基座模型升级为全新一代千亿参数大模型“面壁智能 CPM-Cricket ”，带来更强劲的逻辑推理和语言理解等能力，为“大模型+Agent”落地应用提供基础保障。

经权威测试，CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2。在公考行测和 GMAT 试题的测试表现中，其核心能力与 GPT-4 相当。

SaaS版ChatDev：最快3分钟搞定软件开发

不到两月星标超 1.6 万，屡次登顶 GitHub Trending，并创造出“用一杯可乐的时间和钱开发一款软件”的智能生产力神话，这是“ChatDev 智能体协作开发框架“自开源以来取得的耀眼成绩，持续引爆国内外软件开发和创业者社区的关注和热议。

在此期间，面壁智能产研团队快速响应构建面向用户实际需求的应用原型，首次提出并打造出基于“大模型+Agent”技术能力的应用平台，将 ChatDev 产品化，以 SaaS 服务的形式面向广大用户开放。

SaaS 版 ChatDev 将原始版本的核心能力浓缩成一个更加简洁高效、应用门槛更低的可视化交互平台，即便没有编程经验的普通用户，也能轻松使用。此外，面壁智能还对其流程进行了优化升级，正式发布版本将带来更高的运行效率。

只需三步走，即可实现软件开发革新：

第一步：

登录后，用户只需输入项目名称，进行简单设置，并通过“自定义链”定义公司中的角色、工作流程，就可以启动开发工作。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

第二步：

在收到用户的软件需求指令后，ChatDev 中的智能体们就会根据各自的角色各司其事、统一协作，如同现实世界中软件公司工作情景真实上演。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

第三步：

最快 3 分钟，ChatDev 就能生成可直接运行的应用程序。从“红包雨”这种颇受大众欢迎的营销神器，到“电子名片生成器”这类实用的商务工具，再到“五子棋”、“贪吃蛇”、“太空大战”等各种休闲小游戏……ChatDev 实现了“1 个人+多个 AI Agents”的革新软件开发模式。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

ChatDev 软件开发平台究竟哪里好？

• 效率高：无需进行专业复杂的 prompt 探索，只需简单的需求说明就能后台自动完成整套工作流，让软件开发“降本提效”。

• 可共创：用户不仅可以通过上帝视角监督开发过程，还能直接和智能体 “人机共创”，让软件开发“一步到位”。

• 定制化：用户可根据个人喜好，增加、删除、调换、改变部分功能与设计，让软件开发实现“私人订制”。

SaaS 版本 ChatDev 的推出真正建立起大模型与应用的创新闭环，形成“数据飞轮”，促进平台功能持续迭代，推动 AI Agent 技术广泛应用。

超强模型能力提升，助推“大模型+Agent”生产力跃迁

大模型作为当今科技界“顶流”，如何改变生产方式、提高生产力，进而为社会经济带来真正价值，才是其迷人之处。

面壁智能希望以“大模型 + Agent”战略，布局大模型技术应用之路，不断打造高价值产品系列，驱动新一轮AI原生应用的爆发，迎接 AGI 时代的到来。

然而，应用的创新离不开基础模型能力的提升，面壁智能在基座模型方面也在持续攻坚，不断为产品和应用输送强劲的基础能力保障。

本次全新升级的 CPM-Cricket 是继 CPM-Ant、CPM-Bee 之后的第三代基座模型，在逻辑、代码、知识、指令理解等方面均有大幅提升。

根据在 HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH 等权威 LLM 评测集的结果，CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面已全面超越 LLaMA2

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

伴随 CPM-Cricket 的推出，面壁智能基于 CPM 的多模态智能对话助手「面壁露卡Luca」也在快速成长，升级为 3.0 版本，其逻辑推理能力较首次发布提升了 163.9%，综合能力提升 61.5%。近期，Luca 也已正式面向公众开放服务。

为了测试模型的逻辑推理和语言理解在实践中的真实表现，面壁智能给 Luca 进行了公考行测能力测评。

结果显示，在包括常识判断、数量关系、资料分析、判断推理、语言理解与表达等多种题型的 425 道试题中，Luca 的总成绩表现优异，综合能力与 GPT-4 相当，在判断推理题目的正确率方面优于 GPT-4。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

为了考察 Luca 的全面性，面壁智能还对其进行了英文的 GMAT 模拟测试。结果显示，Luca 在英文环境中的阅读理解和逻辑推理方面与 GPT-4 能力接近。

模型能力的提升取决于底层研发技术的综合实力。面壁智能探索出更为低成本、高效率的模型训练方法，让大模型不仅能 “训出来”，还能 “训得好”、“用起来”。

为此，面壁智能构建了一整套大模型创新研发体系，包括自研的高效训练框架、高效推理框架，大模型压缩工具，以及增量微调、指令微调、提示学习工具包等。此外，面壁智能还原创打造出大模型工具学习引擎，并已集成超过 16000 多个真实 API，可实现一键接入，调用工具解决更多复杂任务。不仅如此，面壁智能还部署了 Int8 量化模型，让模型推理成本降低 50%。

面壁智能打造首个“大模型+Agent” SaaS级产品ChatDev

作为国内最早开展大模型研发的公司之一，面壁智能团队不仅早在 2020 年就发布了国内首个中文大语言模型 CPM-1，同时也是最早在 AI Agent 技术取得突破的大模型公司之一。今年 5 月，面壁智能就陆续推出并开源了 AI Agent “三驾马车”：AgentVerse、ChatDev、XAgent。

通过这些智能体的连接，我们会进入一个全新的 Internet of Agents（IoA） 时代。正如面壁智能的愿景“智周万物”，AI Agent 不仅能够创造新的交互方式，还将带来生产力的跃迁，为行业和用户带来更多想象空间，彻底改变人与人、人与物、物与物的万物交互方式。

ChatDev 产品版本的发布展现并验证了“大模型+Agent”赋能生产力提升和创新交互体验的清晰路径。然而其应用场景绝不局限于软件开发领域，它还可以是拟人的原生智能体，也可以是现实中的人和物的数字孪生智能体。

面壁智能联合创始人、CEO 李大海表示，“大模型+Agent”将会引起新一轮的应用爆发，为行业和用户带来更多新的能力与服务，推动 AI 大模型的场景落地。

目前，面壁智能大模型技术已为数百家企业提供商用服务，覆盖金融、商业、工业、医疗、教育、法律、媒体等多个行业和领域。未来，面壁智能将坚持通过领先的基础模型和高效易用的 Agent 技术与产品应用，打造清晰的 AI 大模型场景化落地路径，为千行百业的可持续发展打造源源不断的新价值高地。

文章来自微信公众号 “ 面壁智能 ”

关键词: AI Agents , ChatDev , AI

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0