引言
传统社会学研究依赖问卷调查和心理实验等方法收集数据,尽管真实可靠,但成本高、难以规模化且存在道德风险。近年来,大语言模型(LLMs)凭借强大的推理和规划能力,为模拟人类行为提供了新的机遇。通过角色扮演,LLMs 驱动的智能体能模拟特定情境下的个体反应,成为研究人类行为的有效工具。
与此同时,多智能体的交互被广泛用于解决问题和模拟复杂动态。LLMs 可被定制为具备特定知识和技能的智能体,通过协作实现目标、完成任务;它们的简单互动也能涌现复杂集体行为,模拟现实中的复杂社会动态。这些模拟为对社会现象的理解与预测提供了新工具,也为政策制定和社会管理提供了支持。
图 1:大模型智能体驱动的社会模拟概览。本文将现有工作分为个体模拟、场景模拟和社会模拟。从左到右,对个体建模的多样性和规模逐渐增加,从右到左,对个体建模的精确性需求增加。
目前,这一领域发展迅速,但现有综述多聚焦于单智能体的架构、特定能力或多智能体系统的某些方面,尚缺乏从个体到社会模拟的系统性回顾。因此,本文试图填补这一空白,为该领域提供全面的概述。考虑到模拟目标以及个体建模在精确性、多样性和规模上的不同需求,本文将现有工作归纳为三种类型:
这三类模拟呈现出递进关系:个体模拟为场景模拟和社会模拟奠定基础,而社会模拟则有潜力构建由无数场景组成的复杂世界。本文依次总结了三类模拟的研究进展,并探讨它们的发展趋势,旨在推动这一领域的进一步发展,同时为跨学科研究提供支持。
个体模拟基于模块化的体系结构,利用特定人物或人群的个性化数据,以高保真度为目标模拟这些对象。本文提出了一个系统化的框架来整理和概括个体模拟的相关工作,从整体上系统地分析和指导个体模拟的设计与应用,通过将智能体的基本架构与个体模拟的特点相结合,这个框架包含:智能体架构、构建方法、模拟对象和评估方法。
图 2: 大模型驱动的智能体个体模拟示意图。个体智能体通常由一个具有概要、记忆、规划和行动模块的框架组成,以模拟特定目标,如人物个体或人群个体。个体模拟可以通过静态和交互的方式进行评估,并观察不同的维度。
有效地模拟个体需要构建一个能够准确再现个体特征的智能体架构。通常,这种架构被模块化为四个核心组件:概要、记忆、规划和行动。
详细论述请读者参阅原论文 Section 3.1,以及表格 1 中对现有代表性工作架构组件的总结。
个体模拟旨在将个体数据整合到 LLMs 中,以实现智能体与个体的对齐,进而模拟个体行为。构建方法分为两种类型:非参数化提示和参数化训练。
详细论述请读者参阅原论文 Section 3.2,以及表格 1 中对现有代表性工作构建方法的总结。
应用场景和目标的不同会影响模拟对象的尺度和粒度。根据模拟的范围和细节,模拟对象可分为人群个体和人物个体两类:
详细论述请读者参阅原论文 Section 3.3,以及表格 1 中对现有代表性工作模拟对象的总结。
个体模拟的评估方法可以分为静态评估和交互评估两类。
详细论述请读者参阅原论文 Section 3.4。
现实世界中,个体不是独立存在的,而是通过合作完成特定任务。场景模拟将一组智能体组织在一个具体场景中,由特定目标或任务驱动其行为。场景模拟通常从设计多智能体系统入手,包括构建环境、建模角色、以及设定组织结构与通信协议,以便有效管理智能体之间的互动。
图 3:场景模拟示意图。在给定特定场景的情况下,构建一个多智能体系统涉及对环境、角色、组织和通信进行建模。场景模拟完成后,通过不同的评估层次和策略进行评估。
随着场景模拟的日益复杂,构建一个能够适用于多场景的统一系统框架尤为重要。现有系统的基本形式可以总结为:“通过受限的通信方式,将智能体组织起来,在特定环境中扮演角色”。基于这一框架,我们归纳了场景模拟的四个核心要素:环境、角色、组织和通信。
详细论述请读者参阅原论文 Section 4.1,以及表格 2 中对现有代表性工作组成要素的总结。
通过利用具备专业知识的智能体的集体能力,场景模拟已广泛应用于多个领域。在此,我们将不同的场景分为两大类:对话驱动场景,涵盖社会互动和问答任务;以及以任务驱动场景,聚焦于特定领域的专业任务。
详细论述请读者参阅原论文 Section 4.2,以及表格 2 中对现有代表性工作场景分类的总结。
在场景模拟中,评估的重点是任务的解决效果。根据评估的范围,可以将其分为任务评估、子任务评估和系统评估,每种评估方法都采用不同的自动化评估、基于大语言模型的评估和人工评估方法来衡量性能。
详细论述请读者参阅原论文 Section 4.3。
社会比单个场景更加复杂,其复杂性体现在组成的多样性、结构的多元性以及非线性效应等多个方面。社会模拟并不以解决具体任务或问题为目标,而是分析和解释大量智能体之间互动所产生的涌现行为及其结果。本文从社会构建元素、场景类型和评估方法三个方面总结了社会模拟的工作。
图 4:社会模拟示意图。构建社会模拟,需要对社会构成、网络、社会影响和结果进行设计。基于此,可以模拟各种场景,并在微观、宏观和系统层级进行评估。
考虑到社会的复杂性,社会模拟的一个主要挑战是弥合个体和社会尺度之间的差距。为此,我们结合社会科学中的一些关键概念,总结提炼出了社会模拟中的 4 个核心元素:组成、网络、社会影响和结果。
详细论述请读者参阅原论文 Section 5.1,以及表格 3 中对现有代表性工作社会构建元素的总结。
社会模拟已广泛应用于与人类社会相关的各类场景,现有研究主要分为三个领域:广义经济学、社会学与政治学以及在线平台。
详细论述请读者参阅原论文 Section 5.2,以及表格 3 中对现有代表性工作的场景分类。
社会模拟的评估主要集中在将模拟结果与现实数据进行比较,评估主要包括微观层级、宏观层级和系统层级。
详细论述请读者参阅原论文 Section 5.3。
图 5:个体模拟趋势示意图,包括粗略模拟、精细模拟和面向情境模拟。
个体模拟经过了三个阶段的演变,分别是粗略模拟、精细模拟和面向情境模拟,如图 5 所示。从 2022 年 6 月起,研究者开始关注粗略模拟,尤其是测试 LLMs 的个性和模拟知名角色等表面特征。到 2023 年 8 月,趋势转向更加精细的个体模拟,研究评估模拟模型的认知方面并提高其模拟能力。到 2024 年 4 月,研究者开始在特定场景中进行个体模拟,进一步扩展了模拟的复杂性和现实性。
图 6:场景模拟趋势示意图,包括简单场景、多阶段场景和合作场景模拟。
场景模拟的发展经历了三个明显的阶段,包括简单场景、多阶段场景、合作场景模拟。从 2023 年 1 月起,研究主要集中在简单场景上,涉及单一目标并促进基本的情境互动。到 2023 年 6 月,研究重点转向多阶段场景,加入了多步骤任务,使智能体能够在不同的情境中进行顺序决策和适应性反应,以实现更复杂的目标。到了 2024 年 2 月,研究逐渐聚焦于多智能体协作场景,强调智能体在复杂的高阶模拟中合作和适应的能力。
图 7:社会模拟趋势示意图,包括构建模拟环境、探索特定场景的对齐,以及扩展规模和模态。
社会模拟的发展可以分为三个阶段。2023 年 6 月起,研究集中在构建初步的模拟环境。在此阶段,研究者主要关注模拟环境的搭建与智能体在环境中基本社交能力(如记忆、对话、简单工具调用等)的实现。到 2024 年 2 月左右,研究重点转向了特定场景下的对齐,特别是聚焦于个性化建模和特定场景中的一些可观察和评测任务,推动了模拟精度和智能体对环境适应能力的提升。2024 年 2 月以来,随着技术迭代和智能体模拟精度的提升,研究逐渐转向了大规模模拟,研究者们在该场景下验证了一些人类社会已有的规律(如马太效应、帕累托法则等),进一步讨论了智能体社会与真实世界的一致性。与此同时,现实生活中的更多模态元素(如视觉、声音等)也被纳入模拟,强化了模拟的真实感和互动性,使得智能体的行为可以更加贴近现实情境。
文章来自微信公众号“机器之心”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0