出版社:电子工业出版社
年代:2018
定价:89.0
强化学习是机器学习的一个分支,是阿尔法狗大战围棋冠军李世石时用到的核心技术。本书从学习强化学习必备的基础知识讲起(基础数学知识+神经网络+TensorFlow),过度到强化学习关注的经典算法(policy Gradient、Actor Critic、Q-Learning等),最后讲解前沿的强化学习方法(例如反向强化学习等)。
书籍详细信息 | |||
书名 | 强化学习精要站内查询相似图书 | ||
丛书名 | 博文视点AI系列 | ||
9787121340000 如需购买下载《强化学习精要》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 电子工业出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 89.0 | 语种 | 简体中文 |
尺寸 | 24 × 17 | 装帧 | 平装 |
页数 | 印数 |
强化学习精要是电子工业出版社于2018.6出版的中图分类号为 TP181 的主题关于 机器学习-算法-研究 的书籍。
(加) 理查德·桑顿 (Richard S. Sutton) , (美) 安德鲁·巴图 (Andrew G. Barto) , 著
(俄罗斯) 马克西姆·拉潘 (Maxim Lapan) , 著
(日) 小高知宏, 著
彭伟, 编著
(荷) 马可·威宁 (Marco Wiering) , (荷) 马丁·范·奥特罗 (Martijn van Otterlo) , 编著
柯良军, 王小强, 编著
邹伟, 鬲玲, 刘昱杓, 著
林强, 编著
刘驰, 等编著