计算机科学 ›› 2007, Vol. 34 ›› Issue (10): 1-7.
• 软件工程与数据库技术 • 下一篇
王蓁蓁 邢汉承 张志政 倪庆剑
WANG Zhen-Zhen ,XING Han-Cheng ,ZHANG Zhi-Zheng ,NI Qing-Jian (School of Computer Science & Engineering, Southeast University, Nanjing 210096)
摘要: 逻辑马尔可夫决策过程和关系马尔可夫决策过程的引入,使得人们可能简洁地、陈述地表达复杂的马尔可夫决策过程。本文首先介绍有关逻辑马尔可夫决策过程和关系马尔可夫决策过程的概念,然后重点介绍它们与普通的马尔可夫决策过程根本不同的一些算法:①依赖于基本状态空间RL的转换法;②把Bellman方程推广到抽象状态空间的方法;③利用策略偏置空间寻求近似最优策略方法。最后对它们的研究现状进行总结及其对它们发展的一些展望。
[1] | . 马尔可夫决策过程两种抽象模式 计算机科学, 2008, 35(10): 6-14. |
|