摘要
本申请涉及人工智能技术领域,尤其涉及一种服务器、中心服务器及基于大模型的任务处理方法。若接收算法类型为大小模型融合的待处理任务,且用于执行小模型任务的第一GPU的剩余资源无法对待处理任务进行处理,为了及时处理任务,若用于执行大模型任务的第二GPU的剩余资源能够基于小模型对待处理任务进行处理,在该第二GPU中加载待处理任务的目标小模型,得到目标小模型输出的第一结果,根据第一结果确定待复检数据,在第二GPU加载目标大模型,基于目标大模型对待复检数据复检,得到待处理任务的目标结果。通过多GPU搭配组合的处理方式提高了资源利用率及任务处理的效率,并通过大小模型相结合的方式提高了任务处理的准确率。