一种模型推理性能优化方法、装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种模型推理性能优化方法、装置、设备和存储介质
申请号:CN202510858008
申请日期:2025-06-25
公开号:CN120409704A
公开日期:2025-08-01
类型:发明专利
摘要
本申请公开了一种模型推理性能优化方法、装置、设备和存储介质,包括:响应于接收到推理请求,识别目标推理模型的结构特征,根据结构特征确定目标推理模型的类型,其中推理请求包括请求参数,目标推理模型用于执行推理请求,根据目标推理模型的类型和请求参数确定第一资源分配,获取系统负载数据,根据系统负载数据确定系统负载状态等级,根据第一资源分配和系统负载状态等级确定第二资源分配,根据第二资源分配对推理请求进行计算,得到推理结果,通过该方法,能够优化资源利用率并提升系统吞吐量。
技术关键词
性能优化方法 资源分配 数据 优化资源利用率 性能优化装置 参数 生成哈希值 高带宽 处理器 频率 哈希算法 序列 提升系统 网络 计算机设备 模块 可读存储介质 格式 存储器