交互式动态影响图的建模及优化算法研究

本书在前期工作的基础上,应用部分可观测马尔可夫决策过程性质、最大奖励期望值原理和行为等价原理,提出新...

2015.12