一种服务器、中心服务器及基于大模型的任务处理方法

申请号：CN202411875163

申请日期：2024-12-18

公开号：CN119847735A

公开日期：2025-04-18

类型：发明专利

摘要

本申请涉及人工智能技术领域，尤其涉及一种服务器、中心服务器及基于大模型的任务处理方法。若接收算法类型为大小模型融合的待处理任务，且用于执行小模型任务的第一GPU的剩余资源无法对待处理任务进行处理，为了及时处理任务，若用于执行大模型任务的第二GPU的剩余资源能够基于小模型对待处理任务进行处理，在该第二GPU中加载待处理任务的目标小模型，得到目标小模型输出的第一结果，根据第一结果确定待复检数据，在第二GPU加载目标大模型，基于目标大模型对待复检数据复检，得到待处理任务的目标结果。通过多GPU搭配组合的处理方式提高了资源利用率及任务处理的效率，并通过大小模型相结合的方式提高了任务处理的准确率。

技术关键词

中心服务器资源数据队列人工智能技术算法

系统为您推荐了相关专利信息

一种面向存储系统的安全数据处理方法及系统

解密密钥密钥管理平台分片面向存储系统加密数据

知识引导的铁路桥梁建造过程可视化仿真方法

场景知识图谱可视化仿真方法实体域施工工艺流程动态可视化

一种基于互联网的机电工程施工信息运维管理方法及系统

机电工程施工运维管理方法三维激光扫描设备高精度定位传感器室内定位标签

一种绞吸船限高区段多锚缆张力自适应调控系统

双流神经网络多模态环境调控系统动态势场三次样条插值算法

一种基于智能合约和多方安全计算的换电站能源交易方法

换电站能源交易方法电池决策电力管理