出版社:科学出版社
年代:2010
定价:45.0
本书对增强学习与近似动态规划的理论、算法及应用进行了深入研究和论述。主要内容包括:求解Markov链学习预测问题的时域差值学习算法和理论;求解连续空间马氏决策问题的梯度增强学习算法;求解马氏决策问题的进化-梯度混合增强学习算法;基于核的增强学习与近似动态规划方法;增强学习在移动机器人导航控制中的应用等。本书是作者在多个国家自然科学基金项目资助下取得的研究成果的总结,意在推动增强学习与近似动态规划理论与应用的发展,对于智能科学的前沿研究和智能学习系统的应用,具有重要的科学意义。
(罗) 卢西恩·布索尼 (Lucian Busoniu) , (荷) 罗伯特·巴布斯卡 (Robert Babuska) , (荷) 巴特·德·舒特 (Bart De Schutter) , (比) 达米安·厄恩斯特 (Damien Ernst) , 著
吴炜, 主编
(日) 小高知宏, 著
(日) 小高知宏, 著
林强, 编著
陈仲铭, 彭凌西, 著
(美) 乔希· 帕特森 (Josh Patterson) , (美) 亚当· 吉布森 (Adam Gibson) , 著
(美) 徳梅萃·P.博塞卡斯 (Dimitri P. Bertsekas) , 著
王永庆, 著