稀疏矩阵乘法加速硬件、推荐系统加速方法和AI芯片

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
稀疏矩阵乘法加速硬件、推荐系统加速方法和AI芯片
申请号:CN202511100096
申请日期:2025-08-07
公开号:CN120610681B
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种稀疏矩阵乘法加速硬件、推荐系统加速方法和AI芯片。该硬件中的数据加载单元,针对稀疏矩阵乘法任务中稠密数据,建立数据搬运任务,将稠密数据搬运至寄存器;归一化加速单元组,根据从寄存器获取的左右矩阵分块执行乘法前激活操作后,将各左右矩阵分块发送至乘法计算单元组;乘法计算单元组,用于根据左右矩阵分块的数据规模,选择乘法计算单元实施乘法计算,并将计算结果提供给加法计算单元组实施加法计算;归一化加速单元组,还用于在需要进行乘法后归一化和/或乘法后激活操作时,根据加法计算结果,实施归一化计算和/或激活操作,得到最终结果。本实施例的技术方案可以在有限的计算资源下,实现快速的稀疏矩阵乘法计算。
技术关键词
稀疏矩阵乘法 推荐系统 数据 加载单元 任务调度 分块 队列 执行器 执行乘法 深度学习模型 规模 转换单元 芯片 流水 参数 分层 元素 序列 动态