计算机科学 ›› 2005, Vol. 32 ›› Issue (8): 128-130.
• • 上一篇 下一篇
张化祥 黄上腾
出版日期:
发布日期:
Zhang HuaXiang;Huang ShangTeng
Online:
Published:
摘要: 本文研究了基于模糊知识的多代理决策问题。通过建立代理决策目标的模糊知识,我们给出了基于模糊收益的多代理决策模型,并研究了基于梯度的代理策略学习算法。
关键词: 模糊集合 对策 梯度学习 多代理 收益 模糊知识 决策问题 决策目标 决策模型 学习算法
Abstract: The multi-agent decision based on fuzzy knowledge is discussed. The agent's fuzzy reward is proposed under the fuzzy knowledge of different decision goals, and a gradient learning algorithm is described to learn the agent's action policy under fuzzy rewar
Key words: Fuzzy set, Game, Gradient learning
张化祥 黄上腾. 多代理模糊收益及策略学习[J]. 计算机科学, 2005, 32(8): 128-130. https://doi.org/
Zhang HuaXiang;Huang ShangTeng. [J]. Computer Science, 2005, 32(8): 128-130. https://doi.org/
0 / / 推荐
导出引用管理器 EndNote|Reference Manager|ProCite|BibTeX|RefWorks
链接本文: https://www.jsjkx.com/CN/
https://www.jsjkx.com/CN/Y2005/V32/I8/128
Cited