计算机科学 ›› 2006, Vol. 33 ›› Issue (12): 156-158.
刘菲 曾广周 宋言伟
LIU Fei, ZENG Guang-Zhou ,SONG Yan-Wei (School of Computer Science and Technology, Shandong University, Jinan 250061)
摘要: 结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并做出相应的决策,进而达成最优的联合动作策略。最后,通过对猎人。猎物追逐问题的仿真试验验证了该算法的收敛性,表明这种学习算法是一种高效、快速的学习方法。
No related articles found! |
|