摘要: 针对传统增强学习算法存在妥协过快导致自身效用降低的缺点,通过设计改进增强学习算法的双边多议题协商模型,引入期望还原率,还原Agent的期望,从而提高协商解的质量。通过实验分析了期望还原率不同取值对协商的影响,并对传统增强学习协商策略、基于时间的协商策略和改进增强学习协商策略的协商效果做了对比。实验表明,在协商次数允许的范围之内,基于期望还原率的改进增强学习算法在双边多议题协商中能够提升双方的效用。
[1] Park S,Yang Sung-Bong.An efficient multilateral negotiationsystem for pervasive computing environments [J].Engineering Applications of Artificial Intelligence,2008,21:633-643 [2] Zeng D,Sycara K.Bayesian learning in negotiation[J].Int’l J.Human-Computer Studies,1998,8:125-141 [3] 李剑,牛少彰.一种基于混合遗传算法的双边多议题协商[J].北京邮电大学学报,2009,2(2):1-4 [4] 程昱,高济,古华茂,等.基于对手态度学习的协商决策模型[J].浙江大学学报:工学版,2008,2(10):1676-1 [5] Mitchell T M.机器学习[M].曾华军,等译.北京:机械工业出版社,2009 [6] 张化祥,黄上腾.基于增强学习的代理谈判模型[J].计算机工程,2004,30(10):137-139 [7] Chen Pei-you,Li Yi-jun,Li Xing.The research on E-business-oriented Automatic Negotiation System based on faithful and dynamic Q-study[C]∥Chinese Control and Decision Conference.Shenyang,2008 [8] 孙天昊,邓俊昆,陈飞,等.基于增强学习协商策略的研究及优化[J].计算机工程与应用,2012,48(23):44-46 [9] 艾解清.双边多议题自动协商研究[D].杭州:浙江大学,2011:46-47 [10] 罗志伟.协同设计系统中图形协同与网络协商的实现[J].重庆理工大学学报:自然科学版,2012,6(7):27-33 |
No related articles found! |
|