模型推理加速的内存池化方法、系统及计算机程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型推理加速的内存池化方法、系统及计算机程序产品
申请号:CN202511023901
申请日期:2025-07-24
公开号:CN120525063B
公开日期:2025-10-14
类型:发明专利
摘要
本公开提供了一种模型推理加速的内存池化方法、系统及计算机程序产品,涉及计算机技术领域。模型为分离池化架构,分离池化架构包括:分离的预填充节点池、解码节点池和CXL内存池,本公开的模型推理加速的内存池化方法,包括:基于第一调度策略将推理请求分配给预填充节点池中的第一预填充节点;第一预填充节点对推理请求进行处理,获得键值缓存;将键值缓存存储于CXL内存池;基于第二调度策略选定解码节点池中的第一解码节点;第一解码节点基于推理请求从CXL内存池中获取键值缓存;以及第一解码节点根据获取的键值缓存生成推理结果。
技术关键词
池化方法 键值 节点 池化架构 解码 计算机程序产品 链路 缓存替换策略 全局调度器 内存管理器 交换机 主机 推理系统 大语言模型 队列 布局 协议 处理器