出版社:清华大学出版社
年代:2019
定价:99.0
该书共14章,大致分为4个部分:第1部分介绍强化学习的基础知识,包括强化学习的定义,发展历程,以及要解决的问题。第2部分包括动态规划方法,蒙特卡罗方法,时间差分方法。第3部分通过集成多个基本算法,或者将值函数、策略做函数近似,第4部分使用强化学习解决两类博弈问题:完美信息博弈和不完美信息博弈。
书籍详细信息 | |||
书名 | 强化学习站内查询相似图书 | ||
丛书名 | 人工智能科学与技术丛书 | ||
9787302538295 如需购买下载《强化学习》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 清华大学出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 99.0 | 语种 | 简体中文 |
尺寸 | 24 × 19 | 装帧 | 平装 |
页数 | 印数 | 2000 |
(荷) 马可·威宁 (Marco Wiering) , (荷) 马丁·范·奥特罗 (Martijn van Otterlo) , 编著
柯良军, 王小强, 编著
刘驰, 等编著
笪庆, 曾安祥, 编著
(日) 杉山将, 著
叶强, 闫维新, 黎斌, 编著
(加) 理查德·桑顿 (Richard S. Sutton) , (美) 安德鲁·巴图 (Andrew G. Barto) , 著
(日) 小高知宏, 著
冯超, 著