计算机科学 ›› 2004, Vol. 31 ›› Issue (4): 96-98.
• 计算机网络与信息安全 • 上一篇 下一篇
张化祥 黄上腾
出版日期:
发布日期:
Online:
Published:
摘要: 在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基于该学习规则的Q值收敛。实验结果与理论证明相一致。
关键词: 学习规则 Q学习 强化学习 收敛性证明 多代理强化学习 学习算法 人工智能
张化祥 黄上腾. 多代理最优响应Q学习及收敛性证明[J]. 计算机科学, 2004, 31(4): 96-98. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2004/V31/I4/96
Cited