计算机科学 ›› 2006, Vol. 33 ›› Issue (12): 156-158.

• 计算机网络与信息安全 • 上一篇    下一篇

多Agent协作的强化学习模型和算法

刘菲 曾广周 宋言伟   

  1. 山东大学计算机科学与技术学院,济南250061
  • 出版日期:2018-11-17 发布日期:2018-11-17
  • 基金资助:
    国家自然科学基金项目资助(编号:60573169).

LIU Fei, ZENG Guang-Zhou ,SONG Yan-Wei (School of Computer Science and Technology, Shandong University, Jinan 250061)   

  • Online:2018-11-17 Published:2018-11-17

摘要: 结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并做出相应的决策,进而达成最优的联合动作策略。最后,通过对猎人。猎物追逐问题的仿真试验验证了该算法的收敛性,表明这种学习算法是一种高效、快速的学习方法。

关键词: 协作学习 强化学习 多Agent学习 学习模型 学习算法

Abstract: The multi-agent cooperative learning process based on Reinforcement Learning is addressed and a new multiagent cooperative learning model is proposed. Based on this model, a cooperative learning algorithm is introduced. This algorithm pays fully attention

Key words: Cooperative learning, Reinforcement learning, Multi-agent learning, Learning model, Learning algorithm

No related articles found!
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!