一种模型推理性能优化方法、装置、设备和存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种模型推理性能优化方法、装置、设备和存储介质
申请号:
CN202510858008
申请日期:
2025-06-25
公开号:
CN120409704A
公开日期:
2025-08-01
类型:
发明专利
摘要
本申请公开了一种模型推理性能优化方法、装置、设备和存储介质,包括:响应于接收到推理请求,识别目标推理模型的结构特征,根据结构特征确定目标推理模型的类型,其中推理请求包括请求参数,目标推理模型用于执行推理请求,根据目标推理模型的类型和请求参数确定第一资源分配,获取系统负载数据,根据系统负载数据确定系统负载状态等级,根据第一资源分配和系统负载状态等级确定第二资源分配,根据第二资源分配对推理请求进行计算,得到推理结果,通过该方法,能够优化资源利用率并提升系统吞吐量。
技术关键词
性能优化方法
资源分配
数据
优化资源利用率
性能优化装置
参数
生成哈希值
高带宽
处理器
频率
哈希算法
序列
提升系统
网络
计算机设备
模块
可读存储介质
格式
存储器