一种基于渐进起草树的大语言模型推理加速方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于渐进起草树的大语言模型推理加速方法及系统
申请号:CN202510804204
申请日期:2025-06-17
公开号:CN120654833A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种基于渐进起草树的大语言模型推理加速方法及系统,所述方法包括:构建初始起草树,初始起草树的根节点关联已解码的上下文序列,其余节点通过随机初始化生成扰动词元;基于节点之间的依赖关系设置注意力掩码和位置编码,使得每个节点仅能关注其所在路径上的前序节点;利用大语言模型对初始起草树进行推理,生成草稿词元,并根据草稿词元扩展起草树及更新候选池;通过预设宽度约束和深度约束对扩展后的起草树进行剪枝;从候选池中提取候选草稿树。本发明通过将传统自回归的单步预测任务转化为并行的起草和验证过程,提出基于渐进起草树的草稿生成机制,在保持原始的模型架构和参数的情况下实现了高效的推理加速。
技术关键词
节点 大语言模型 非暂态计算机可读存储介质 注意力 加速系统 生成机制 处理器 有效性 解码 关系 编码 序列 语义 模块 存储器 电子设备 层级 规模 程序 参数
系统为您推荐了相关专利信息
客户 智能标签 网络结构特征 连续特征 标签类别
多路径 算法 节点 链路 定义
误差 识别方法 编码器 样本 特征值
生成神经网络 注意力神经网络 文本生成方法 注意力机制 训练集
融合特征 遥感图像语义分割 调制特征 频域特征提取 多尺度特征融合