一种模型强化学习优化系统、方法及电子设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
验证码登录
×
发送
登录即代表您已同意AITNT
用户协议
和
隐私政策
登录
登录成功后会自动刷新界面
AITNT公众号
AITNT APP
AITNT交流群
搜索
未登录
首页
AI中心
退出
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI 源力市场
寻求报道
一种模型强化学习优化系统、方法及电子设备
申请号:
CN202511310470
申请日期:
2025-09-15
公开号:
CN120806042B
公开日期:
2025-12-02
类型:
发明专利
摘要
本申请公开了一种模型强化学习优化系统、方法及电子设备,涉及人工智能技术领域,由于各计算设备均分配有待优化模型权重、参考模型权重和奖励模型权重,即计算设备部署有全部类型的智能体,能够同时执行预训练语言模型优化过程中的多种计算任务,避免了相关技术中不同阶段任务在不同设备串行执行导致的设备计算资源空闲和浪费的问题,提高了对预训练语言模型的优化效率。
技术关键词
进程
学习优化方法
预训练语言模型
管理器
电子设备
存储计算机程序
人工智能技术
策略
指令
模块
存储器
处理器
阶段