知识发现
知识发现封面图

知识发现

史忠植, 著

出版社:清华大学出版社

年代:2010

定价:50.0

书籍简介:

本书是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。本书全面而又系统地介绍了知识发现的重要概念、发展过程、方法和技术,内容包括决策树、支持向量机、迁移学习等。

书籍目录:

第1章 绪论

1.1 知识

1.2 知识发现的过程

1.3 知识发现的任务

1.4 知识发现的方法

1.4.1 统计方法

1.4.2 机器学习

1.4.3 神经计算

1.4.4 可视化

1.5 知识发现的对象

1.5.1 数据库

1.5.2 文本

1.5.3 web信息

1.5.4 空间数据

1.5.5 图像和视频数据

1.6 知识发现系统

第2章 决策树

2.1 归纳学习

2.2 决策树学习

2.3 cls学习算法

2.4 id3学习算法

2.4.1 信息论简介

2.4.2 信息论在决策树学习中的意义及应用

2.4.3 id3算法

2.4.4 id3算法应用举例

2.4.5 c4.5 算法

2.5 决策树的改进算法

2.5.1 二叉树判定算法

2.5.2 按信息比值进行估计的方法

2.5.3 按分类信息估值

2.5.4 按划分距离估值的方法

2.6 决策树的评价

2.7 简化决策树

2.7.1 简化决策树的动机

2.7.2 决策树过大的原因

2.7.3 控制树的大小

2.7.4 修改测试属性空间

2.7.5 改进测试属性选择方法

2.7.6 对数据进行限制

2.7.7 改变数据结构

2.8 连续性属性离散化

2.9 基于偏置变换的决策树学习算法bsdt

2.9.1 偏置的形式化

2.9.2 表示偏置变换

2.9.3 算法描述

2.9.4 过程偏置变换

2.9.5 基于偏置变换的决策树学习算法bsdt

2.9.6 经典案例库维护算法tcbm

2.9.7 偏置特征抽取算法

2.9.8 改进的决策树生成算法gsd

2.9.9 实验结果

2.10 单变量决策树的并行处理

2.10.1 并行决策树算法

2.10.2 串行算法的并行化

2.11 归纳学习中的问题

第3章 支持向量机

3.1 统计学习问题

3.1.1 经验风险

3.1.2 vc维

3.2 学习过程的一致性

3.2.1 学习过程一致性的经典定义

3.2.2 学习理论的重要定理

3.2.3 vc熵

3.3 结构风险最小归纳原理

3.4 支持向量机

3.4.1 线性可分

3.4.2 线性不可分

3.5 核函数

3.5.1 多项式核函数

3.5.2 径向基函数

3.5.3 多层感知机

3.5.4 动态核函数

3.6 邻近支持向量机

3.7 极端支持向量机

第4章 迁移学习

4.1 概述

4.2 相似性关系

4.2.1 语义相似性

4.2.2 结构相似性

4.2.3 样本相似性

4.2.4 相似性计算

4.3 归纳迁移学习

4.3.1 基于采样的归纳迁移

4.3.2 基于特征的归纳迁移

4.3.3 基于参数的归纳迁移

4.4 推导迁移学习

4.4.1 基于采样的知识迁移

4.4.2 基于特征的知识迁移

4.5 主动迁移学习

4.5.1 主动学习

4.5.2 主动迁移学习算法

4.5.3 迁移学习分类器

4.5.4 决策函数

4.6 多源领域知识的迁移学习

4.7 强化学习中的迁移

4.7.1 行为迁移

4.7.2 知识迁移

第5章 聚类分析

5.1 概述

5.2 相似性度量

5.2.1 相似系数

5.2.2 属性的相似度量

5.3 划分方法

5.3.1 k均值算法

5.3.2 k中心点算法

5.3.3 大型数据库的划分方法

5.4 层次聚类方法

5.4.1 birch算法

5.4.2 cure算法

5.4.3 rock算法

5.5 基于密度的聚类

5.6 基于网格方法

5.7 基于模型方法

5.8 模糊聚类

5.8.1 传递闭包法

5.8.2 动态直接聚类法

5.8.3 最大树法

5.9 蚁群聚类方法

5.9.1 基本模型

5.9.2 lf算法

5.9.3 基于群体智能的聚类算法csi

5.9.4 混合聚类算法csim

5.10 聚类方法的评价

第6章 关联规则

6.1 概述

6.2 基本概念

6.3 二值型关联规则挖掘

6.3.1 ais算法

6.3.2 setm算法

6.3.3 apriori算法

6.3.4 apriori算法的改进

6.4 频繁模式树挖掘算法

6.5 垂直挖掘算法

6.6 挖掘关联规则的数组方法

6.7 频繁闭项集的挖掘算法

6.8 最大频繁项集挖掘算法

6.9 增量式关联规则挖掘

6.10 模糊关联规则的挖掘

6.11 任意多表间关联规则的并行挖掘

6.11.1 问题的形式描述

6.11.2 单表内大项集的并行计算

6.11.3 任意多表间大项集的生成

6.11.4 跨表间关联规则的提取

6.12 基于分布式系统的关联规则挖掘算法

6.12.1 候选集的生成

6.12.2 候选数据集的本地剪枝

6.12.3 候选数据集的全局剪枝

6.12.4 合计数轮流检测

6.12.5 分布式挖掘关联规则的算法

第7章 粗糙集

7.1 概述

7.1.1 知识的分类观点

7.1.2 新型的隶属关系

7.1.3 概念的边界观点

7.2 知识的约简

7.2.1 一般约简

7.2.2 相对约简

7.2.3 知识的依赖性

7.3 决策表的约简

7.3.1 属性的依赖性

7.3.2 一致决策表的约简

7.3.3 非一致决策表的约简

7.4 粗糙集的扩展模型

7.4.1 可变精度粗糙集模型

7.4.2 相似模型

7.4.3 基于粗糙集的非单调逻辑

7.4.4 与其他数学工具的结合

7.5 粗糙集的实验系统

7.6 粒度计算

7.6.1 模糊集模型

7.6.2 粗糙集模型

7.6.3 商空间理论模型

7.6.4 相容粒度空间模型

第8章 神经网络

8.1 概述

8.1.1 基本的神经网络模型

8.1.2 神经网络的学习方法

8.2 人工神经元及感知机模型

8.2.1 基本神经元

8.2.2 感知机模型

8.3 前向神经网络

8.3.1 前向神经网络模型

8.3.2 多层前向神经网络的误差反向传播(bp)算法

8.3.3 bp算法的若干改进

8.4 径向基函数神经网络

8.4.1 插值问题

8.4.2 正则化问题

8.4.3 rbf网络学习方法

8.5 反馈神经网络

8.5.1 离散型hopfield网络

8.5.2 连续型hopfield网络

8.5.3 hopfield网络应用

8.5.4 双向联想记忆模型

8.6 随机神经网络

8.6.1 模拟退火算法

8.6.2 玻尔兹曼机

8.7 自组织特征映射神经网络

8.7.1 网络的拓扑结构

8.7.2 网络自组织算法

8.7.3 监督学习

第9章 贝叶斯网络

9.1 概述

9.1.1 贝叶斯网络的发展历史

9.1.2 贝叶斯方法的基本观点

9.1.3 贝叶斯网络在数据挖掘中的应用

9.2 贝叶斯概率基础

9.2.1 概率论基础

9.2.2 贝叶斯概率

9.3 贝叶斯学习理论

9.3.1 几种常用的先验分布选取方法

9.3.2 计算学习机制

9.3.3 贝叶斯问题求解

9.4 简单贝叶斯学习模型

9.4.1 简单贝叶斯模型

9.4.2 简单贝叶斯模型的提升

9.4.3 提升简单贝叶斯分类的计算复杂性

9.5 贝叶斯网络的建造

9.5.1 贝叶斯网络的结构及建立方法

9.5.2 学习贝叶斯网络的概率分布

9.5.3 学习贝叶斯网络的网络结构

9.6 贝叶斯潜在语义模型

9.7 半监督文本挖掘算法

9.7.1 网页聚类

9.7.2 对含有潜在类别主题词的文档的类别标注

9.7.3 基于简单贝叶斯模型学习标注和未标注样本

第10章 隐马尔可夫模型

10.1 马尔可夫过程

10.2 隐马尔可夫模型

10.3 评估问题

10.3.1 前向算法

10.3.2 后向算法

10.4 viterbi算法

10.5 学习算法

10.6 嵌入式隐马尔可夫模型

10.7 基于状态驻留时间的分段概率模型

第11章 图挖掘

11.1 概述

11.2 图的基础知识

11.2.1 图同构

11.2.2 频繁子图

11.3 频繁子图挖掘

11.3.1 基于apriori的算法

11.3.2 基于模式增长的算法

11.4 约束图模式挖掘

11.4.1 特殊的子图挖掘

11.4.2 基于约束的子结构模式挖掘

11.5 图分类

11.5.1 基于核的图分类方法

11.5.2 最优核矩阵学习

11.5.3 组合维核方法

11.6 图模型

11.7 图像标注模型

11.7.1 混合生成式和判别式模型的图像语义标注框架

11.7.2 构造集群分类器链

11.8 社会网络分析

11.8.1 中心度分析

11.8.2 子群分析

11.8.3 社会网络分析的应用

11.8.4 社会网络分析软件

第12章 进化计算

12.1 概述

12.2 进化系统理论的形式模型

12.3 达尔文进化算法

12.4 基本遗传算法

12.4.1 基本遗传算法的构成要素

12.4.2 基本遗传算法的一般框架

12.5 遗传算法的数学理论

12.5.1 模式定理

12.5.2 积木块假设

12.5.3 隐并行性

12.6 遗传算法编码方法

12.6.1 二进制编码方法

12.6.2 格雷码编码方法

12.6.3 浮点数编码方法

12.6.4 符号编码方法

12.6.5 多参数级联编码方法

12.6.6 多参数杂交编码方法

12.7 适应度函数

12.8 遗传操作

12.8.1 选择算子

12.8.2 杂交算子

12.8.3 变异算子

12.8.4 反转操作

12.9 变长度染色体遗传算法

12.10 小生境遗传算法

12.11 混合遗传算法

12.1 2并行遗传算法

12.1 3分类器系统

第13章 分布式知识发现

13.1 概述

13.2 分布式计算技术

13.3 同构海量数据挖掘

13.4 异构海量数据挖掘

13.5 任务调度

13.6 基于主体的分布式知识发现

13.7 基于网格的分布式知识发现

13.7.1 knowledgegrid

13.7.2 weka4ws

13.7.3 datamininggrid

13.7.4 gridminer

13.8 面向服务的分布式知识发现

13.8.1 soddm

13.8.2 anteater

13.9 基于对等网的分布式知识发现

13.10 基于云平台的分布式知识发现

第14章 web知识发现

14.1 概述

14.2 web知识发现的任务

14.2.1 web内容挖掘

14.2.2 web结构挖掘

14.2.3 web使用挖掘

14.3 web知识发现方法

14.3.1 文本的特征表示

14.3.2 tfidf向量表示法

14.3.3 特征子集的选取

14.4 模型质量评价

14.5 基于文本挖掘的汉语词性自动标注研究

14.6 文本分类

14.7 文本聚类

14.7.1 层次凝聚法

14.7.2 平面划分法

14.7.3 简单贝叶斯聚类算法

14.7.4 k近邻聚类算法

14.7.5 分级聚类

14.7.6 基于概念的文本聚类

14.8 文本摘要

14.9 web主题建模

14.10 用户兴趣挖掘

第15章 认知神经科学知识发现

15.1 概述

15.2 脑功能成像分析

15.3 同步振荡

15.4 特征捆绑

15.4.1 带噪声的神经元发放方式

15.4.2 神经元输入的贝叶斯耦合方式

15.4.3 神经元之间的竞争关系

15.5 神经元集群仿真

参考文献

内容摘要:

知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据资源中发现知识宝藏,将为知识创新和知识经济的发展作出贡献。本书全面而又系统地介绍了知识发现的方法和技术,反映了当前知识发现研究的最新成果和进展。全书共分15章。第1章是绪论,概述知识发现的重要概念和发展过程。下面三章重点讨论分类问题,包括决策树、支持向量机和迁移学习。第5章阐述聚类分析。第6章是关联规则。第7章讨论粗糙集和粒度计算。第8章介绍神经网络,书中着重介绍几种实用的算法。第9章探讨贝叶斯网络。第10章讨论隐马尔可夫模型。第11章探讨图挖掘。第12章讨论进化计算和遗传算法。第13章探讨分布式知识发现,它使海量数据挖掘成为可能。最后两章以Web知识发现、认知神经科学为例,介绍知识发现的应用。本书内容新颖,认真总结了作者的科研成果,取材国内外最新资料,反映了当前该领域的研究水平。论述力求概念清晰,表达准确,算法丰富,突出理论联系实际,富有启发性。本书可以用作高等院校有关专业的研究生和高年级本科生的知识发现、数据挖掘、机器学习等课程教材,也可供从事知识发现、数据挖掘、机器学习、智能信息处理、模式识别、智能控制研究和知识管理的科技人员阅读参考。

书籍规格:

书籍详细信息
书名知识发现站内查询相似图书
丛书名中国计算机学会学术著作丛书
9787302239574
如需购买下载《知识发现》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位清华大学出版社
版次2版印次1
定价(元)50.0语种简体中文
尺寸26 × 19装帧平装
页数印数 3000

书籍信息归属:

知识发现是清华大学出版社于2010.12出版的中图分类号为 TP18 的主题关于 人工智能 ,知识工程 的书籍。