一种服务器、中心服务器及基于大模型的任务处理方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种服务器、中心服务器及基于大模型的任务处理方法
申请号:CN202411875163
申请日期:2024-12-18
公开号:CN119847735A
公开日期:2025-04-18
类型:发明专利
摘要
本申请涉及人工智能技术领域,尤其涉及一种服务器、中心服务器及基于大模型的任务处理方法。若接收算法类型为大小模型融合的待处理任务,且用于执行小模型任务的第一GPU的剩余资源无法对待处理任务进行处理,为了及时处理任务,若用于执行大模型任务的第二GPU的剩余资源能够基于小模型对待处理任务进行处理,在该第二GPU中加载待处理任务的目标小模型,得到目标小模型输出的第一结果,根据第一结果确定待复检数据,在第二GPU加载目标大模型,基于目标大模型对待复检数据复检,得到待处理任务的目标结果。通过多GPU搭配组合的处理方式提高了资源利用率及任务处理的效率,并通过大小模型相结合的方式提高了任务处理的准确率。
技术关键词
中心服务器 资源 数据 队列 人工智能技术 算法
系统为您推荐了相关专利信息
解密密钥 密钥管理平台 分片 面向存储系统 加密数据
场景知识图谱 可视化仿真方法 实体域 施工工艺流程 动态可视化
机电工程施工 运维管理方法 三维激光扫描设备 高精度定位传感器 室内定位标签
双流神经网络 多模态环境 调控系统 动态势场 三次样条插值算法
换电站 能源交易方法 电池 决策 电力管理