多Agent协作的强化学习模型和算法

计算机科学 ›› 2006, Vol. 33 ›› Issue (12): 156-158.

• 计算机网络与信息安全 • 上一篇下一篇

多Agent协作的强化学习模型和算法

刘菲曾广周宋言伟

山东大学计算机科学与技术学院,济南250061

出版日期:2018-11-17 发布日期:2018-11-17
基金资助:
国家自然科学基金项目资助（编号：60573169）.

LIU Fei, ZENG Guang-Zhou ,SONG Yan-Wei （School of Computer Science and Technology, Shandong University, Jinan 250061）

Online:2018-11-17 Published:2018-11-17

摘要/Abstract

摘要： 结合强化学习技术讨论了多Agent协作学习的过程，构造了一个新的多Agent协作学习模型。在这个模型的基础上，提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点，使得Agent基于对动作长期利益的估计来预测其动作策略，并做出相应的决策，进而达成最优的联合动作策略。最后，通过对猎人。猎物追逐问题的仿真试验验证了该算法的收敛性，表明这种学习算法是一种高效、快速的学习方法。

关键词: 协作学习强化学习多Agent学习学习模型学习算法

Abstract: The multi-agent cooperative learning process based on Reinforcement Learning is addressed and a new multiagent cooperative learning model is proposed. Based on this model, a cooperative learning algorithm is introduced. This algorithm pays fully attention

Key words: Cooperative learning, Reinforcement learning, Multi-agent learning, Learning model, Learning algorithm

刘菲曾广周宋言伟. 多Agent协作的强化学习模型和算法[J]. 计算机科学, 2006, 33(12): 156-158. https://doi.org/

LIU Fei, ZENG Guang-Zhou ,SONG Yan-Wei （School of Computer Science and Technology, Shandong University, Jinan 250061）. [J]. Computer Science, 2006, 33(12): 156-158. https://doi.org/

参考文献

Metrics

Viewed

Full text

Abstract

Cited

Shared

Discussed

多Agent协作的强化学习模型和算法

PDF (PC)

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 0

Metrics

本文评价

推荐阅读 0