化学数据挖掘方法与应用

化学数据挖掘方法与应用

陆文聪, 李国正, 刘亮, 包新华, 著

出版社:化学工业出版社

年代:2011

定价:78.0

书籍简介:

本书主要介绍了化学常用数据挖掘方法和技术的基本原理,并重点介绍了模式识别、支持向量机、集成学习方法在材料设计、工业优化、构效关系、生物信息学等领域的应用研究实例。书中所有应用研究实例全部取自作者的应用研究课题,有关算法程序可采用作者开发的应用软件HyperMiner(见附录1)。

书籍目录:

1 化学数据挖掘综述

1.1 化学数据挖掘的目的和意义

1.1.1 数据挖掘与材料设计

1.1.2 数据挖掘与构效关系

1.1.3 数据挖掘与工业优化

1.2 化学数据挖掘方法概要

1.3 化学数据挖掘应用进展

1.3.1 机器学习的数学本质

1.3.2 统计模型的“过拟合”问题

1.3.3 模式识别优化算法及其改进

1.3.4 支持向量机算法的应用效果

1.3.5 建立综合运用多种算法的数据处理平台

参考文献

2 模式识别基本原理和方法

2.1 模式识别方法的基本原理和预备知识

2.2 模式识别经典方法

2.2.1 最近邻方法

2.2.2 主成分分析方法

2.2.3 多重判别矢量和Fisher判别矢量方法

2.2.4 偏最小二乘方法

2.2.5 非线性映照方法

2.3 模式识别应用技术

2.3.1 最佳投影识别方法

2.3.2 超多面体建模

2.3.3 逐级投影建模方法

2.3.4 最佳投影回归方法

2.3.5 模式识别逆投影方法

2.4 决策树算法

2.4.1 C4.5算法

2.4.2 随机决策树算法

2.4.3 随机森林算法

参考文献

3 人工神经网络和遗传算法

3.1 人工神经网络

3.1.1 反向人工神经网络

3.1.2 Kohonen自组织网络

3.2 遗传算法

参考文献

4 支持向量机方法

4.1 统计学习理论(SLT)简介

4.1.1 背景

4.1.2 原理

4.2 支持向量分类(SVC)算法

4.2.1 线性可分情形

4.2.2 非线性可分情形

4.3 支持向量机(SVM)的核函数

4.4 支持向量回归(SVR)方法

4.4.1 线性回归情形

4.4.2 非线性回归情形

4.5 支持向量机分类与回归算法的实现

4.6 应用前景

参考文献

5 集成学习方法

5.1 集成学习算法概述

5.2 Boosting算法

5.3 Adaboost算法

5.4 Bagging算法

参考文献

6 特征选择方法和应用

6.1 特征选择研究概述

6.2 基于支持向量分类的特征选择

6.2.1 后向浮动搜索算法

6.2.2 用SVMBFS进行特征选择

6.3 支持向量回归的特征选择

6.3.1 PRIFER算法

6.3.2 计算结果的评价准则

6.3.3 PRIFER方法与常规计算方法的结果比较

6.4 集成学习及其特征选择

6.4.1 个体子集的特征选择

6.4.2 基于预报风险的特征选择

6.4.3 PRIFEB算法

6.4.4 UCI数据集上的计算结果

参考文献

7 钙钛矿型离子导体导电性的数据挖掘

7.1 钙钛矿型离子导体与燃料电池材料

7.2 钙钛矿的结构特性

7.3 钙钛矿型晶体的原子参数

7.3.1 钙钛矿容忍因子

7.3.2 钙钛矿平均离子半径

7.3.3 钙钛矿单位晶格边值与临界半径

7.3.4 钙钛矿组成元素的电负性

7.3.5 钙钛矿平均离子极化率与所带电荷

7.3.6 钙钛矿原子参数与量化参数的组合

7.4 钙钛矿离子导体数据的收集

7.5 数据集的自变量筛选

7.5.1 自变量的经典统计相关性分析

7.5.2 贝叶斯网络进行变量关联性分析

7.5.3 前进后退法进行自变量筛选

7.6 多种数据挖掘方法建立原子参数钙钛矿导电能力模型

7.6.1 PLS,BPANN与SVR建立的回归模型

7.6.2 回归模型的留一法交叉验证与独立测试集验证

7.6.3 SVR模型的敏感性分析

参考文献

8 熔盐相图数据库的数据挖掘

8.1 相图计算的意义

8.2 原子参数模式识别方法概述

8.3 智能数据库技术在材料科学中的应用

8.4 熔盐相图智能数据库的研究和开发

8.5 判别卤化物体系是否形成中间化合物

8.6 白钨矿结构物相含稀土异价固溶体的形成规律

8.6.1 白钨矿型物相及其异价固溶体的形成规律

8.6.2 白钨矿型MⅠM′Ⅲ(XO4)2(X=Mo,W)物相及其异价固溶体的形成规律

8.7 钙钛矿及类钙钛矿结构的物相的若干规律性

8.7.1 钙钛矿结构的复卤化物的若干规律性

8.7.2 含钙钛矿结构层的夹层化合物的规律

参考文献

9 镀锡薄钢板质量的数据挖掘

9.1 镀锡薄钢板的发展

9.2 镀锡板生产过程简介

9.3 镀锡板耐蚀性能与工业生产软熔条件的关系

9.4 镀锡板耐蚀性能与实验室模拟软熔条件的关系

9.5 工业生产中防止淬水斑产生的数学模型

9.6 镀锡板淬水斑的实验室模拟研究

参考文献

10 合成氨生产效益的数据挖掘

10.1 氨合成装置简介

10.1.1 生产原理

10.1.2 生产流程

10.1.3 生产数据的复杂性和数据挖掘的必要性

10.2 DMOS合成氨优化系统的开发

10.2.1 DMOS合成氨优化系统简介

10.2.2 DMOS合成氨优化系统离线版软件

10.2.3 DMOS合成氨优化系统在线版软件

10.2.4 DMOS合成氨优化系统优化生产实施步骤

10.2.5 DMOS合成氨优化系统主要特点

10.3 氨合成装置生产优化模型的研究

10.3.1 数据集

10.3.2 1号合成塔生产优化数学模型

10.4 讨论和结论

参考文献

11 分子结构性质关系的数据挖掘

11.1 偶氮染料最大吸收波长的支持向量回归模型

11.1.1 分子结构特征参数的计算和筛选

11.1.2 支持向量回归的计算结果

11.1.3 讨论

11.2 胍类化合物Na/H交换抑制活性的支持向量分类模型

11.2.1 特征参数的计算与筛选

11.2.2 支持向量分类的计算结果

11.2.3 与其他方法的比较

11.3 抗艾滋病药物HEPT活性的支持向量分类模型

11.3.1 特征参数的计算与筛选

11.3.2 支持向量分类的计算结果

11.3.3 与其他方法的比较

11.4 三唑类化合物分子筛选的最佳投影识别模型

11.4.1 特征参数的计算和筛选

11.4.2 特征参数间的共线性检查

11.4.3 OPR法的计算

11.4.4 OPR法的测试结果

11.4.5 结论

参考文献

12 HIV1蛋白酶特异性位点的数据挖掘

12.1 数据集准备

12.2 mRMR方法和特征选取

12.3 不同的特征子集建模预报能力比较

12.4 特征分析和结论

参考文献

13 蛋白质结构及功能类型预测

13.1 用集成学习方法预测蛋白质的亚细胞定位

13.1.1 蛋白质亚细胞定位的生物学基础及研究现状

13.1.2 蛋白质亚细胞定位数据集以及特征参数的提取

13.1.3 亚细胞定位预测中模型参数的选择与模型的验证

13.1.4 分析与讨论

13.2 蛋白质结构类型的集成学习方法预测

13.2.1 蛋白质结构类型简介及研究现状

13.2.2 数据集以及特征参数的提取

13.2.3 预测蛋白质结构类型时的模型参数选择与模型验证

13.2.4 分析与讨论

13.3 膜蛋白类型的集成学习方法预测

13.3.1 膜蛋白简介及计算预测研究现状

13.3.2 膜蛋白预测的数据集以及特征参数的提取

13.3.3 预测膜蛋白质类型的模型参数选择与模型验证

13.3.4 预测膜蛋白质类型的模型变量分析

13.4 蛋白质亚细胞定位和膜蛋白类型预报的在线Web服务

参考文献

附录1 “HyperMiner数据挖掘软件”下载和应用说明

一、软件简介和下载方法

二、应用案例:VPTC材料最佳配方及最佳工艺条件的探索

附录2 第6章所用的数据集

一、大脑胶质瘤数据集

二、多元校正数据集

三、基因芯片数据集

参考文献

内容摘要:

《化学数据挖掘方法与应用》主要介绍了化学常用数据挖掘方法和技术的基本原理,并重点介绍了模式识别、支持向量机、集成学习方法在材料设计、工业优化、构效关系、生物信息学等领域的应用研究实例。书中所有应用研究实例全部取自作者的应用研究课题,有关算法程序可采用作者开发的应用软件HyperMiner(见附录1)。
《化学数据挖掘方法与应用》可供化学、化工及相关领域的科研人员和工程技术人员阅读,亦可作为高等学校的教学参考书。

书籍规格:

书籍详细信息
书名化学数据挖掘方法与应用站内查询相似图书
丛书名21世纪计算机化学丛书
9787122127082
如需购买下载《化学数据挖掘方法与应用》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位化学工业出版社
版次1版印次1
定价(元)78.0语种简体中文
尺寸24 × 17装帧平装
页数印数

书籍信息归属:

化学数据挖掘方法与应用是化学工业出版社于2011.12出版的中图分类号为 O6-39 的主题关于 数据采集-计算机应用-化学 的书籍。