出版社:科学出版社
年代:2016
定价:80.0
从与环境交互中学习是人类获取知识的主要方法,也是人类提高智能水平的基本途径。人类智能研究的一个最核心问题就是构建具有类似人类智能的系统。该系统的一个主要特征就是能够适应未知环境,并逐渐增强其自身能力。本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括:强化学习基本理论和大规模强化学习基本理论。
郭宪, 方勇纯, 编著
(美) 考希克·巴拉克里希南 (Kaushik Balakrishnan) , 著
高扬, 叶振斌, 著
郭宪, 宋俊潇, 方勇纯, 著
日经XTREND, 编著
(意) 吉安卡洛·扎克尼, (孟加拉) 穆罕默德·礼萨·卡里姆, (埃及) 艾哈迈德·门沙维, 著
杨博雄, 张德军, 吴亦奇, 著
闫涛, 周琦, 编著
程世东, 编著