基于连续强化学习的数据处理方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于连续强化学习的数据处理方法及系统
申请号:
CN202510026660
申请日期:
2025-01-08
公开号:
CN119962704A
公开日期:
2025-05-09
类型:
发明专利
摘要
本发明公开了基于连续强化学习的数据处理方法及系统,属于机器学习和人工智能领域,其具体包括:从情景记忆模块和回放缓存模块中采样转换数据,计算先前和当前任务的策略网络梯度,并据此计算梯度夹角;根据梯度夹角调整当前任务梯度方向,并生成对抗性样本;使用对抗性样本更新策略网络和批评网络参数,同时动态调整学习率;迭代训练过程中,不断更新记忆模块和缓存模块,并定期评估模型性能;该方法能有效提升强化学习模型的训练效率和泛化能力,避免模型遗忘旧知识。
技术关键词
对抗性
数据处理方法
策略
网络
数据处理系统
强化学习模型
样本
模型更新
参数
强化学习框架
反余弦函数
记忆
回放模块
时序
动态
符号
格式
算法