一种基于正交特征的大语言模型量化方法及加速器架构

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于正交特征的大语言模型量化方法及加速器架构
申请号:CN202511587377
申请日期:2025-11-03
公开号:CN121031687A
公开日期:2025-11-28
类型:发明专利
摘要
本发明属于大语言模型量化技术领域,具体涉及一种基于正交特征的大语言模型量化方法及加速器架构,量化方法将大语言模型的激活张量分割为多个列块,并以列块为粒度为整个激活张量分配FP4量化格式。本发明列块的概念定义为:将激活张量的矩阵分割为多个元素数量相同的段,其中段中各元素连续排列在矩阵的第一维度的同一行中,且排列在第二维度的连续的多个列中;列块包括第二维度的多个列,每个列块中列的数量与段中元素的数量一致。本发明克服了现有大语言模型分组量化技术中存在的缺陷,解决了大语言模型精度与硬件效率之间的矛盾。
技术关键词
格式 地址生成器 加速器 索引 大语言模型 数据 缩放单元 指数 执行矩阵乘法 元素 阵列 乘法器 核心 符号 处理单元 因子 模块 分割方法 周期
系统为您推荐了相关专利信息
印刷管理系统 条码 印刷品 印刷生产线 印刷设备
小波神经网络 物体分类方法 节点特征 多尺度特征提取 物体分类技术
电子设备控制方法 终端设备 多模态 异常消息 指令
仿真环境 物体 场景 大语言模型 语义
大语言模型 计算机可读非易失性存储介质 样本生成方法 生成系统 自然语言文本