计算机科学 ›› 2007, Vol. 34 ›› Issue (10): 1-7.

• 软件工程与数据库技术 •    下一篇

逻辑马尔可夫决策编程和关系马尔可夫决策编程若干最新进展

王蓁蓁 邢汉承 张志政 倪庆剑   

  1. 东南大学计算机科学与工程学院,南京210096
  • 出版日期:2018-11-16 发布日期:2018-11-16
  • 基金资助:
    国家自然科学基金(No.90412014).

WANG Zhen-Zhen ,XING Han-Cheng ,ZHANG Zhi-Zheng ,NI Qing-Jian (School of Computer Science & Engineering, Southeast University, Nanjing 210096)   

  • Online:2018-11-16 Published:2018-11-16

摘要: 逻辑马尔可夫决策过程和关系马尔可夫决策过程的引入,使得人们可能简洁地、陈述地表达复杂的马尔可夫决策过程。本文首先介绍有关逻辑马尔可夫决策过程和关系马尔可夫决策过程的概念,然后重点介绍它们与普通的马尔可夫决策过程根本不同的一些算法:①依赖于基本状态空间RL的转换法;②把Bellman方程推广到抽象状态空间的方法;③利用策略偏置空间寻求近似最优策略方法。最后对它们的研究现状进行总结及其对它们发展的一些展望。

关键词: 逻辑马尔可夫决策过程 关系马尔可夫决策过程

Abstract: Using logical Markov decision processes (LOMDPs) and relational Markov decision processes (RMDPs) one can compactly and declaratively represent complex Markov decision processes. This paper firstly introduces central concepts of LOMDPs and RMDPs. Then sev

Key words: Logical Markov decision processes, Relational Markov decision processes

[1] .
马尔可夫决策过程两种抽象模式

计算机科学, 2008, 35(10): 6-14.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!