计算机科学 ›› 2004, Vol. 31 ›› Issue (4): 96-98.

• 计算机网络与信息安全 • 上一篇    下一篇

多代理最优响应Q学习及收敛性证明

张化祥 黄上腾   

  1. 上海交通大学计算机科学与工程系上海200030
  • 出版日期:2018-11-17 发布日期:2018-11-17

  • Online:2018-11-17 Published:2018-11-17

摘要: 在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基于该学习规则的Q值收敛。实验结果与理论证明相一致。

关键词: 学习规则 Q学习 强化学习 收敛性证明 多代理强化学习 学习算法 人工智能

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!