出版社:科学出版社
年代:2009
定价:38.0
本书主要围绕基于神经网络的学习、强化学习和进化学习3个方面阐述机器学习理论、方法及其应用,共3部分13章。第一部分是神经网络学习及其在复杂非线性系统中的控制,第二部分是强化学习的大规模或连续空间表示问题,第三部分则是对分布估计优化算法进行研究,为便于应用本书阐述的算法,书后附有部分机器学习算法源程序。
《智能科学技术著作丛书》序
序
前言
第1章 机器学习概述
1.1 机器学习的概念
1.2 机器学习的发展历史
1.3 机器学习的分类
1.3.1 基于学习策略的分类
1.3.2 基于学习方法的分类
1.3.3 基于学习方式的分类
1.3.4 基于数据形式的分类
1.3.5 基于学习目标的分类
1.4 机器学习的主要策略
1.4.1 基于神经网络的学习
1.4.2 进化学习
1.4.3 强化学习
1.5 本书主要内容及安排
1.6 本章小结
参考文献
第2章 基于时间差分的神经网络预测控制
2.1 方法的提出
2.2 基于时间差分的Elman网络预测控制
2.2.1 Elman网络预测模型
2.2.2 反馈校正模型
2.2.3 参考轨迹
2.2.4 滚动优化算法
2.3 仿真研究
2.3.1 预测仿真
2.3.2 跟踪仿真
2.4 本章小结
参考文献
第3章 基于径向基函数网络的机械手迭代学习控制
3.1 机械手迭代学习控制
3.2 基于RBF网络的迭代学习控制
3.2.1 选取查询点的k个最接近样例
3.2.2 利用RBF网络拟合k个数据点
3.2.3 预测查询点的控制输入
3.3 仿真研究
3.4 本章小结
参考文献
第4章 自适应T-S型模糊径向基函数网络
4.1 RBF网络和模糊推理系统的功能等价性
4.2 自适应T-S型FRBF网络结构
4.3 自适应T-S型FRBF网络学习
4.3.1 网络学习动态
4.3.2 网络结构学习
4.3.3 网络参数学习
4.3.4 算法步骤
4.4 仿真研究
4.5 本章小结
参考文献
第5章 基于强化学习的自适应PID控制
5.1 Actor-Critic学习
5.2 基于强化学习的自适应PID控制
5.2.1 基于强化学习的自适应PID控制结构
5.2.2 基于RBF网络的Actor-Critic学习
5.3 控制器设计步骤
5.4 仿真研究
5.5 本章小结
参考文献
第6章 基于动态回归网络的强化学习控制
6.1 Q学习
6.2 基于Elman网络的强化学习控制
6.2.1 基于Elman网络的Q学习
6.2.2 Elman网络学习算法
6.2.3 基于Elman网络的Q学习方法步骤
6.3 仿真研究
6.4 本章小结
参考文献
第7章 基于自适应FRBF网络的强化学习
7.1 基于自适应FRBF网络的Actor-Qitic学习
7.1.1 基于自适应FRBF网络的Actorcritic学习结构
7.1.2 自适应FRBF网络的学习
7.1.3 算法步骤
7.1.4 仿真研究
7.2 基于自适应FRBF网络的Q学习
7.2.1 基于自适应FRBF网络的Q学习结构
7.2.2 自适应FRBF网络的学习
7.2.3 算法步骤
7.2.4 仿真研究
7.3 本章小结
参考文献
第8章 基于支持向量机的强化学习
8.1 SVM
8.1.1 机器学习
8.1.2 核学习
8.1.3 SVM的思想
8.1.4 SVM的重要概念
8.2 基于SVM的强化学习
8.2.1 基于SVM的Q学习结构
8.2.2 基于滚动时间窗机制的SVM
8.2.3 算法步骤
8.2.4 仿真研究
8.3 基于协同最小二乘SVM的强化学习
8.3.1 基于协同最小二乘SVM的Q学习
8.3.2 LS-SVRM逼近状态一动作对到值函数的映射关系
8.3.3 LS-SVCM逼近状态空间到动作空间的映射关系
8.3.4 仿真研究
8.4 本章小结
参考文献
第9章 基于高斯过程分类器的强化学习
9.1 基于高斯过程分类器的强化学习
9.2 在线高斯过程分类器学习
9.3 算法步骤
9.4 仿真研究
9.5 本章小结
参考文献
第10章 基于图上测地高斯基函数的策略迭代强化学习
10.1 环境的图论描述
10.2 测地高斯基函数
10.3 递归最小二乘策略迭代
10.4 算法步骤
10.5 仿真研究
10.6 本章小结
参考文献
第11章 多目标优化问题的差分进化一分布估计算法
11.1 多目标优化
11.2 多目标优化的差分进化一分布估计算法
11.2.1 多目标优化的DE-EDA混合算法步骤
11.2.2 多目标优化的DE子代生成策略
11.2.3 多目标优化的EDA子代生成策略
11.3 实例研究
11.4 本章小结
参考文献
第12章 基于细菌觅食行为的分布估计算法在预测控制中的应用
12.1 方法的提出
12.2 基于改进分布估汁算法的预测控制
12.2.1 预测模型
12.2.2 反馈校正模型
12.2.3 基于改进分布估计算法的滚动优化
12.3 实验分析
12.3.1 Benchmark函数实验
12.3.2 预测控制的曲线跟踪实验
12.4 本章小结
参考文献
第13章 一种多样性保持的分布估计算法
13.1 混沌模型
13.2 多样性保持分布估计算法
13.3 Benchmark函数实验
13.4 在支持向量机参数选择中的应用
13.4.1 算法步骤
13.4.2 Chebyshev混沌时间序列预测
13.5 本章小结
参考文献
附录 部分机器学习算法MATLAB源程序
程序1 第11章 多目标差分进化-分布估计算法MATLAB源程序
程序2 第12章 基于细菌觅食行为的分布估计算法部分MATLAB源程序
程序3 第13章 一种多样性保持的分布估计算法部分MATLAB程序
机器学习的研究不仅是人工智能领域的核心问题,而且已成为近年来计算机科学与技术领域中最活跃的研究分支之一。《机器学习理论、方法及应用》主要围绕基于神经网络的学习、强化学习和进化学习三个方面阐述机器学习理论、方法及其应用,共三部分13章。一部分是神经网络学习及其在复杂非线性系统中的控制,包括基于时间差分的神经网络预测控制,基于径向基函数网络的机械手迭代学习控制,自适应T_S型模糊径向基函数网络等。第二部分是强化学习的大规模或连续空间表示问题,包括基于强化学习的白适应PID控制,基于动态回归网络的强化学习控制,基于自适应模糊径向基函数网络、支持向量机和高斯过程的连续空间强化学习,基于图上测地高斯基函数的策略迭代强化学习等。第三部分则是对分布估计优化算法进行研究,包括多目标优化问题的差分进化一分布估计算法,基于细菌觅食行为的分布估计算法在预测控制中的应用,一种多样性保持的分布估计算法及其在支持向量机参数选择问题中的应用等。为便于应用《机器学习理论、方法及应用》阐述的算法,书后附有部分机器学习算法MATLAB源程序。
《机器学习理论、方法及应用》可供理工科高等院校计算机科学、信息科学、人工智能和自动化技术及相关专业的教师及研究生阅读,也可供自然科学和工程技术领域中的研究人员参考。
本书全面、系统地介绍了机器学习的基本概念、发展历史、分类及部分机器学习的主要策略等,并重点围绕当前机器学习领域的热点问题展开讨论,包括:神经网络学习及其在复杂非线性系统控制中的应用、大规模或连续空间下的强化学习以及分布估计优化算法等。此外,为理论联系实际和便于读者理解算法思想,书中还介绍了机器学习方法的若干典型应用,如机械手轨迹跟踪控制、小车爬山最短时间控制、倒立摆平衡控制、小船过河控制、机器人迷宫行走以及复杂数值函数优化问题等。
书籍详细信息 | |||
书名 | 机器学习理论、方法及应用站内查询相似图书 | ||
9787030254399 如需购买下载《机器学习理论、方法及应用》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN | |||
出版地 | 北京 | 出版单位 | 科学出版社 |
版次 | 1版 | 印次 | 1 |
定价(元) | 38.0 | 语种 | 简体中文 |
尺寸 | 24 × 0 | 装帧 | 平装 |
页数 | 印数 |