一种推理模型的调度方法及系统、电子设备、存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种推理模型的调度方法及系统、电子设备、存储介质
申请号:
CN202510408403
申请日期:
2025-04-01
公开号:
CN120469773A
公开日期:
2025-08-12
类型:
发明专利
摘要
本申请实施例涉及模型推理技术领域,公开了一种推理模型的调度方法及系统、电子设备、存储介质。应用于子负载均衡管理器,方法包括:接收本地预填充节点生成的预填充结果;检测本地解码节点是否支持对预填充结果进行解码处理;在本地解码节点支持对预填充结果进行解码处理的情况下,调度本地解码节点对预填充结果进行解码处理;在本地解码节点不支持对预填充结果进行解码处理的情况下,将预填充结果转发至其它子负载均衡管理器,以通过其它子负载均衡管理器调度远程解码节点对预填充结果进行解码处理,有利于提高推理效率。
技术关键词
管理器
解码
节点
负载均衡器
推理技术
电子设备
资源
调度系统
处理器通信
可读存储介质
存储器
指令
队列
计算机
终端
参数
系统为您推荐了相关专利信息
1
一种基于图表征的多组学癌症样本表示方法及相关装置
样本
基因表达数据
启动子
网络
矩阵
2
一种基于自适应图强化学习的谣言检测方法、装置及设备
谣言检测方法
神经网络模型
社交媒体平台
数据收集模块
可读存储介质
3
一种基于随机采样算法的无人艇路径搜索方法、程序、设备及存储介质
路径搜索方法
节点
无人艇
策略
生成随机
4
一种基于浏览器下载和查看文档的方法及系统
沙箱
策略
团队
解密密钥
下载管理器
5
一种区域轨道交通路网动态风险评估方法及系统
区域轨道交通
动态风险评估方法
列车
延误模型
站点