基于可分解MDP模型的MAS协作策略优化及分布执行

计算机科学 ›› 2009, Vol. 36 ›› Issue (1): 39-42.

基于可分解MDP模型的MAS协作策略优化及分布执行

王晓伶慕德俊刘哲元袁源

西北工业大学自动化学院,西安710072

出版日期:2018-11-16 发布日期:2018-11-16
基金资助:
本文受国防基础科研项目（C2720061361）,教育部博士点基金（20020699026）资助.

WANG Xiao-ling ,MU De-jun ,LIU Zhe-yuan ,YUAN Yuan （School of Automation, Northwestern Polytechnicai University, Xi＇an 710072, China）

Online:2018-11-16 Published:2018-11-16

摘要/Abstract

摘要： 不确定环境下MAS生成协作策略的复杂度关系到协作任务能否成功实现。为降低马尔可夫决策模型生成MAS协作策略的复杂度，减少协作通信量，改进了可分解MDP模型生成策略树的方法。利用Bayesian网络中agent状态之间存在的条件独立性与上下文独立性，分解并优化SPI算法生成的策略树，使得MAS中处于独立状态的agent可以分布独立运行，只有在需要同其他agent协商时才进行通信。通信时采用端对端的方式，agent不仅知道协商内容、协商时机，而且知道协作的目标。实验表明，采用该协作策略MAS在完成协作任务获得

关键词: 多智能体系统可分解马尔可夫决策过程贝叶斯网络上下文独立条件独立

Abstract: The complexity of MAS cooperation strategy in uncertain environment determines the success of cooperation task. In order to reduce the complexity created by factored MDP model and the cooperation traffic,the method of creating strategy tree by the model w

Key words: MAS,Factored Dec-MDP,Bayesian network,Context-specific independence,Conditional independence

王晓伶慕德俊刘哲元袁源. 基于可分解MDP模型的MAS协作策略优化及分布执行[J]. 计算机科学, 2009, 36(1): 39-42. https://doi.org/

WANG Xiao-ling ,MU De-jun ,LIU Zhe-yuan ,YUAN Yuan （School of Automation, Northwestern Polytechnicai University, Xi＇an 710072, China）. [J]. Computer Science, 2009, 36(1): 39-42. https://doi.org/

参考文献

Metrics

Viewed

Full text

Abstract

Cited

Shared

Discussed