
流式深度学习终于奏效了!强化学习之父Richard Sutton力荐
流式深度学习终于奏效了!强化学习之父Richard Sutton力荐自然智能(Natural intelligence)过程就像一条连续的流,可以实时地感知、行动和学习。流式学习是 Q 学习和 TD 等经典强化学习 (RL) 算法的运作方式,它通过使用最新样本而不存储样本来模仿自然学习。这种方法也非常适合资源受限、通信受限和隐私敏感的应用程序。
来自主题: AI技术研报
5828 点击 2024-11-29 15:18