出版社:机械工业出版社
年代:2005
定价:30.0
本书从数据中提取并验证模型的基本理论。
出版者的话
专家指导委员会
译者序
中文版前言
序
前言
第一部分机器学习工具与技术
第1章绪论
1.1数据挖掘和机器学习
1.1.1描述结构模式
1.1.2机器学习
1.1.3数据挖掘
1.2简单的例子:天气问题和其他
1.2.1天气问题
1.2.2隐形眼镜:一个理想化的问题
1.2.3鸢尾花:一个经典的数值型数据集
1.2.4CPU性能:介绍数值预测
1.2.5劳资协商:一个更真实的例子
1.2.6大豆分类:一个经典的机器学习的成功例子
1.3应用领域
1.3.1决策包含评判
1.3.2图像筛选
1.3.3负载预测
1.3.4诊断
1.3.5市场和销售
1.3.6其他应用
1.4机器学习和统计学
1.5用于搜索的概括
1.5.1枚举概念空间
1.5.2偏差
1.6数据挖掘和道德
1.7补充读物
第2章输入:概念、实例和属性
2.1概念
2.2样本
2.3属性
2.4输入准备
2.4.1数据收集
2.4.2ARFF格式
2.4.3稀疏数据
2.4.4属性类型
2.4.5残缺值
2.4.6不正确的值
2.4.7了解数据
2.5补充读物
第3章输出:知识表达
3.1决策表
3.2决策树
3.3分类规则
3.4关联规则
3.5包含例外的规则
3.6包含关系的规则
3.7数值预测树
3.8基于实例的表达
3.9聚类
3.10补充读物
第4章算法:基本方法
4.1推断基本规则
4.1.1残缺值和数值属性
4.1.2讨论
4.2统计建模
4.2.1残缺值和数值属性
4.2.2用于文档分类的贝叶斯模型
4.2.3讨论
4.3分治法:创建决策树
4.3.1计算信息量
4.3.2高度分支属性
4.3.3讨论
……
第5章可信度:评估机器学习结果
第6章实现:真正的机器学习方案
第7章转换:处理输入和输出
第8章继续:扩展和应用
第二部分Weka机器学习平台
第9章weka简介
第10章Explorer界面
第11章KnowledgeFlow界面
第12章Experimenter界面
第13章命令行界面
第14章嵌入式机器学习
第15章编写新学习方案
参考文献
索引
正如所有受到商业注目的新兴技术一样,数据挖掘的运用也是极其多样化的。言过其实的报导声称可以建立算法,在数据的海洋里发现秘密。但事实上机器学习中没有魔术,没有隐藏的力量,没有炼金术。有的只是一些可以将有用的信息从原始数据中提炼出来的清晰明了的实用技术。本书叙述了这些技术并展示了它们是如何工作的。本书对1999年的初版做了重大的改动。虽说核心概念没有变化,但本书做了更新,反映出过去五年的变化。本书提供了机器学习理论概念的完整基础,此外还对实际工作中应用的相关工具和技术提了一些建议。 本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树、关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存在缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘任务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。