微调界面“所见即所得”,生成角色更加“拟人”。
36氪获悉,1月9日,百川智能正式发布角色大模型Baichuan-NPC。Baichuan-NPC优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色更加真实生动。
百川智能由搜狗创始人王小川于2023年4月创立,36氪此前曾做报道,也在持续关注百川智能研发动态。
除了发布模型以外, 百川智能此次还推出了“角色创建平台+搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。
大模型概念自ChatGPT问世以来备受关注,尤其也为游戏等领域带来更多想象空间。OpenAI最早就是利用《DOTA 2》训练AI,通过模拟现实世界的混乱和复杂确立了大模型的开发方向和基础。AI技术也已经被引入游戏行业的NPC定制、绘图、场景建模等应用场景中,帮助游戏行业实现降本增效。
但是,当前想要将大模型运用到游戏研发流程中仍面临不少挑战,其中最大的挑战是当下的大模型在角色扮演上“不够拟人”,削弱了用户的沉浸式游戏体验。
模型在角色扮演中是否足够“拟人”,主要由模型的基础能力和角色扮演一致性两个方面来决定。
其中,基础能力既包括模型的通用智能水准,还包含角色知识、对话能力、情节演绎以及逻辑推理四个专项能力。而强化这些能力的最佳方式是在预训练阶段通过高质量数据集进行针对性训练。百川智能收集了大量行业网站、高质量书籍、优质剧本数据,对Baichuan-NPC进行了超过3T Tokens的领域知识预训练。
此外,Baichuan-NPC还使用多方法模型合成数据进行预训练阶段的领域知识增强,缓解了逆转诅咒(Reversal Curse)问题,大幅度提升Token利用效率。
角色扮演一致性问题指的是,通用语言模型在角色“演绎”过程中,非常容易跳出“角色设定”变回“智能助手”或做出不符合角色人设的言行。针对这一问题,百川智能将思维链对齐技术引入到角色模型对齐中,让模型的思考过程和思考之后的行动表现更接近人类,提升了角色一致性,增强模型的基础对话能力和角色演绎能力。
Baichuan-NPC示例
据百川智能,为了验证模型各项能力,Baichuan-NPC参与了CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院联合推出的对话类角色扮演Agent评估标准)评测,测试结果显示其在对话能力、角色一致性、扮演吸引力等方面具备优势,位于中文领域角色模型前列。
当前,行业内的游戏角色构建主要通过API调用实现,存在开发流程门槛高、周期长等问题。对此,百川智能在Baichuan-NPC基础上推出了由“角色创建平台+搜索增强知识库”组成的开发套件。通过标准化模板、自定义选项、所见即得的调优界面及搜索增强知识库,开发套件为用户提供了一个自由度更高且无需编写代码的低成本解决方案。
百川角色大模型官网
为提高角色定制自由度和真实度,百川智能自研了强多轮对齐和搜索增强知识库两项技术。强多轮对齐技术通过设计System Prompt中的角色设定字段,保证了角色言行响应系统指令定制的敏感性和稳定性。
简单来说,用户在系统提示(System Prompt)中定义了角色特征后,角色就会完全遵循用户设定,进行相应的“演绎”。
不同性格设定下的孙悟空
同时,百川智能将搜索技术与角色知识能力相融合,基于最新研发的SOTA模型BCTE(Baichuan-Text-Embedding),为角色和知识库提供了灵活的“多对多”关联方式。用户上传角色所需的知识文档并自定义回复方式后,就能降低角色产生幻觉的可能性,丰富了角色“内涵”。
此外,平台还提供了一键复制功能。完成角色调试后,用户可以在查看代码页面一键复制全部角色代码,然后将角色代码集成到业务场景中。这种“所调即所得”的方式,有效缩减了企业定制角色的时间和人员成本。
微调界面
目前,百川智能已经与创梦天地、完美世界、爱奇艺等众多泛娱乐行业的头部品牌建立了深度合作关系,共同拓展AIGC创作的应用场景。
文章来自于36氪 “王怡宁”,作者 “王怡宁”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0