一句话，满足两个广告商！谷歌最新「Token拍卖模型」，多LLM联合创作广告词

6978点击 2025-02-19 15:09

谷歌研究人员提出了一种创新的token拍卖模型，通过「竞拍」的方式，让智能体在文本生成过程中进行出价，确保最终输出能满足各方利益，实现最佳效果。这一机制优化了广告、内容创作等领域的协作。

当多个LLM智能体共同创作内容时，它们会如何协调彼此的「话语权」？

想象一下，在广告投放中，A航空公司和B度假村都希望吸引用户的目光，但单独宣传各自的服务可能不如联合推广来得有吸引力。

那么，如何让AI智能体像人类一样展开博弈，在竞争与合作之间找到最佳平衡？

谷歌研究人员提出了一种创新的「token拍卖模型」，让LLM在文本生成过程中通过「竞拍」来决定最终输出，确保每个智能体的利益最大化，同时生成最优质的内容。

这种机制不仅能优化广告创意，还能拓展至智能客服、内容创作等多个领域，重新定义AI协作。

以广告为例，当用户搜索「夏威夷度假」时，网页上可能会出现一个广告位。A航空公司和B度假村这两家广告商，都希望在这个位置展示自家的广告。

一句话，满足两个广告商！谷歌最新「Token拍卖模型」，多LLM联合创作广告词

他们分别借助LLM生成广告内容，比如A公司的「乘坐A航空，飞向夏威夷」，B度假村的「在B度假村，享受夏威夷的美景」。

但如果能将两者的优势结合，形成联合广告「乘坐A航空抵达夏威夷，在B度假村享受梦幻一周的度假体验」无疑会更具吸引力，也能更好地满足用户夏威夷度假的需求。

假设有两个分别代表虚拟广告商A航空和B度假村的智能体，它们的任务是合作一则联合广告创意。

然而，这种合作并不容易实现。

每个LLM背后的广告商都有自己的偏好和利益诉求。广告商们都希望自家的产品或服务能在广告中被重点提及，并且突出展示那些他们认为更有吸引力的特点。

这就好比在一场团队比赛中，每个队员都想让自己负责的部分成为焦点。

这种情况下，如何协调多个LLM的输出，让它们共同生成一个既能满足各方利益，又能达到最佳效果的联合输出，成为了一个需要解决的问题。

Token「拍卖」模型

为了解决上述问题，研究人员提出了token拍卖模型。

该模型以token为单位，逐个进行拍卖。在每次拍卖中，每个LLM作为竞拍者，根据自身的能力和意愿对下一个token进行出价。模型的核心任务包括：

1. 扩展共享的token序列：决定下一个添加到文本中的token。

2. 确定每个竞拍者的支付费用：通过支付函数计算每个LLM需要支付的费用。

分布聚合函数在此过程中扮演裁判角色，综合考虑每个LLM提供的token分布和出价，生成新的聚合分布。支付函数则负责确定每个智能体的支付金额，激励其真实地表达自身偏好。

先来看看单个LLM是如何工作的。当模型接收到一段输入文本后，会根据自己所学的知识和模式，给出下一个可能出现的token的概率分布。

例如，输入「机制设计为」，模型可能会输出 [(大型，0.8), (生成式，0.2)]，这意味着下一个token是「大型」的概率为80%，是「生成式」的概率为20%。

基于这种概率分布，LLM可以自动生成文本，从一个初始的提示文本开始，不断根据概率分布选择下一个token，直到生成一个完整的文本。

token拍卖模型在此基础上进行了拓展，它以token为单位，逐个进行拍卖。

在这个「拍卖会」上，每个LLM都是一个「竞拍者」，它们根据自己的能力和意愿出价。

同时，token拍卖模型承担着两个关键任务：一是扩展共享的token序列，也就是决定下一个添加到文本中的token；二是确定每个「竞拍者」需要支付的「费用」。这两个任务分别由分布聚合函数和支付函数来完成。

一句话，满足两个广告商！谷歌最新「Token拍卖模型」，多LLM联合创作广告词

Token拍卖模型架构

分布聚合函数就像是一个裁判，它综合考虑每个LLM给出的token分布和它们的出价，然后给出一个新的聚合后的token分布。

假设有三个LLM智能体，当前共享的token序列是「机制设计为」，智能体1的LLM给出的分布是 [(大型，0.8)，(生成式，0.2)]，出价为1；智能体2的分布是 [(大型，1.0)]，出价为2；智能体3的分布是 [(生成式，1.0)]，出价为2。

那么，分布聚合函数可能会根据出价加权平均的方式，得到一个新的聚合分布 [(大型，0.56)，(生成式，0.44)] 。

设计空间缩减

在Token拍卖模型的设计中，研究人员强调了以下两个理想属性：

支付单调性：如果一个LLM提高了出价，那么在最终的联合输出中，其偏好应得到更好的体现。

一致聚合：不同LLM的分布应以合理、一致的方式进行聚合。

通过严谨的数学推导，研究人员发现，这两个属性等同于要求分布聚合函数具有单调性。这一发现缩小了分布聚合函数的设计空间，使得模型设计和分析更加简洁。

支付函数负责确定每个智能体需要支付的费用。支付单调性意味着如果一个智能体提高了出价，那么它在最终的联合输出中应该得到更好的待遇，也就是聚合后的分布应该朝着它更偏好的方向变化。

一致聚合则要求不同的LLM在参与拍卖时，它们的分布能够以一种合理、一致的方式进行聚合。

「第二价格」支付机制

在拍卖理论中，「第二价格」支付方式被证明能够提供良好的激励效果。

在传统的单物品拍卖中，「第二价格」支付是指把物品卖给出价最高的竞拍者，但让他支付第二高的出价。

在token拍卖模型中，研究人员也借鉴了这一理念。他们证明了（在一些合理的假设条件下），任何单调的分布聚合函数都可以采用类似「第二价格」的支付方式。

这种支付方式的好处在于，它可以促使智能体更真实地出价，因为即使他们提高出价赢得了竞拍，也不需要支付过高的费用，从而避免了智能体为了获得更好的结果而盲目抬高出价的情况。

最优聚合策略

为了设计最优的分布聚合函数，研究人员从先进的LLM训练方法中汲取灵感，构建了聚合损失函数。

该函数为每个输出分布关联一个总损失值，目标是通过调整分布聚合函数，使总损失最小化。

研究人员提出了两种有效的分布聚合函数：

线性分布聚合函数：输出分布为出价加权平均值。

对数线性分布聚合函数：在对数空间中执行加权平均操作。

这两种聚合函数在不同的场景下都有着良好的表现，为实际应用提供了更多的选择。

实验结果

为了验证token拍卖模型的有效性，研究人员进行了一系列实验。

他们选择了现有的LLM，并通过提示调整（prompt tuning）的方式，让模型扮演不同的广告商角色。

在前面提到的A航空公司和B度假村的例子中，研究人员展示了在不同的出价相对权重（λ）下，线性聚合规则和对数线性聚合规则生成的广告内容。

随着λ值的变化，生成的广告内容呈现出有趣的变化。

当λ=1时，广告主要提及A航空公司；随着λ逐渐减小，广告开始同时提及A航空公司和B度假村。当λ=0时，广告则主要宣传B度假村。

实验结果显示，随着出价权重的变化，生成的广告内容能够合理地体现各方的利益诉求，实现了不同广告商之间的有效协作。

此外，研究人员还展示了更多不同提示，包括竞争广告商场景下的实验结果，进一步证明了token拍卖模型的灵活性和有效性，为多个LLM的协作提供了方案。

一句话，满足两个广告商！谷歌最新「Token拍卖模型」，多LLM联合创作广告词

LLM的机制设计研究为多个LLM的协同工作带来了启发。

Token拍卖模型的提出，解决了多模型协作中的关键问题，还为后续的研究和应用奠定了基础。

从实际应用的角度来看，这种机制在广告、内容创作、智能客服等领域都有着广阔的应用前景。

例如，在广告领域，它可以让不同品牌的广告更巧妙地融合，提高广告的吸引力和效果；在内容创作方面，多个智能体可以通过这种机制共同创作出更丰富、多元的作品。

参考资料：https://research.google/blog/mechanism-design-for-large-language-models/

文章来自于“新智元”，作者“英智”。

一句话，满足两个广告商！谷歌最新「Token拍卖模型」，多LLM联合创作广告词

关键词: AI , 谷歌AI , AI广告 , 拍卖模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0