基于时序性能增益的训练与处理方法、装置、设备及介质
申请号:CN202511246082
申请日期:2025-09-02
公开号:CN120953893A
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于时序性能增益的训练与处理方法、装置、设备及介质,包括:获取视频样本生成视频熵因子以调整奖励强度并形成训练流程,构建有序帧与打乱帧内容生成回答结果,对比回答结果得到时序性能增益,结合奖励强度与时序性能增益生成奖励信号,输入策略优化过程更新策略参数并处理训练流程生成训练输出,更新训练模型直至获得目标模型,利用目标模型完成任务。本发明通过视频熵因子突出复杂样本,结合时序性能增益强化跨帧推理,使奖励信号同时体现样本难度与时序差异,避免模型依赖单帧,提升视频推理的稳定性和泛化能力。
技术关键词
时序
视频
时间校正
因子
模型更新
强度
策略更新
运动
信号
语义
参数
计算机设备
场景
复杂度
样本
序列
人工智能技术
模块
医疗健康