一种模型强化学习优化系统、方法及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种模型强化学习优化系统、方法及电子设备
申请号:CN202511310470
申请日期:2025-09-15
公开号:CN120806042B
公开日期:2025-12-02
类型:发明专利
摘要
本申请公开了一种模型强化学习优化系统、方法及电子设备,涉及人工智能技术领域,由于各计算设备均分配有待优化模型权重、参考模型权重和奖励模型权重,即计算设备部署有全部类型的智能体,能够同时执行预训练语言模型优化过程中的多种计算任务,避免了相关技术中不同阶段任务在不同设备串行执行导致的设备计算资源空闲和浪费的问题,提高了对预训练语言模型的优化效率。
技术关键词
进程 学习优化方法 预训练语言模型 管理器 电子设备 存储计算机程序 人工智能技术 策略 指令 模块 存储器 处理器 阶段