一种基于渐进起草树的大语言模型推理加速方法及系统

申请号：CN202510804204

申请日期：2025-06-17

公开号：CN120654833A

公开日期：2025-09-16

类型：发明专利

摘要

本发明公开了一种基于渐进起草树的大语言模型推理加速方法及系统，所述方法包括：构建初始起草树，初始起草树的根节点关联已解码的上下文序列，其余节点通过随机初始化生成扰动词元；基于节点之间的依赖关系设置注意力掩码和位置编码，使得每个节点仅能关注其所在路径上的前序节点；利用大语言模型对初始起草树进行推理，生成草稿词元，并根据草稿词元扩展起草树及更新候选池；通过预设宽度约束和深度约束对扩展后的起草树进行剪枝；从候选池中提取候选草稿树。本发明通过将传统自回归的单步预测任务转化为并行的起草和验证过程，提出基于渐进起草树的草稿生成机制，在保持原始的模型架构和参数的情况下实现了高效的推理加速。

技术关键词

节点大语言模型非暂态计算机可读存储介质注意力加速系统生成机制处理器有效性解码关系编码序列语义模块存储器电子设备层级规模程序参数

系统为您推荐了相关专利信息

基于AI的客户智能标签提取方法及系统

客户智能标签网络结构特征连续特征标签类别

适用于非保序选路标准的多路径路由方法

多路径算法节点链路定义

异常流量识别方法、装置、电子设备及存储介质

误差识别方法编码器样本特征值

一种基于混合稀疏注意力神经网络的文本生成方法

生成神经网络注意力神经网络文本生成方法注意力机制训练集

一种基于多方向高频调制的遥感图像语义分割方法

融合特征遥感图像语义分割调制特征频域特征提取多尺度特征融合