数据挖掘原理与应用
数据挖掘原理与应用封面图

数据挖掘原理与应用

(美) 迈克伦南 (MacLennan,J.) , (美) 唐朝晖 (Tang,Z.H.) , (美) 克里沃茨 (Crivat,B.) , 著

出版社:清华大学出版社

年代:2010

定价:58.0

书籍简介:

本书全面介绍了SQL Server 2008中数据挖掘的功能,并对这些功能的应用作了较为详尽的讲述。

作者介绍:

Jamie Mac Lennan,Microsoft公司SQL Server Analysis Services事业部的。位开发主管。他在SQL Server数据挖掘方面有超过25项专利,并且编写了大量关于SQL Server数据挖掘技术的著作。   唐朝晖(ZhaoHui Tang),Microsoft ad Center实验室的团队项目经理,Microsoft Keyword Services Platform的   发明人。   Bogdan Crivat,Microsoft公司SQL Server Analysis Services的资深软件设计工程师,主要研究方向是数据挖掘平台。   审校者简介:   杨大川,中国科学院软件学院兼职教授,毕业于美国纽约州立大学布法罗分校计算机系,曾担任美国硅谷Annuncio Software等公司的首席工程帅。归国后,2003年创办了北京迈思奇科技有限公司并担任技术总监,为国内外多家人中型企业提供商业智能咨询和项目实施服务,并逐渐从高新技术外包开发走向了自主知识产权产品的研发道路。曾荣获微软全球最有价值专家(MVP)称号,并于2008年荣获“中关村年度优秀创业留学人员”称号。

书籍目录:

第1章 SQLServer2008数据挖掘介绍

1.1 数据挖掘解决的商业问题

1.2 数据挖掘的任务

1.2.1 分类

1.2.2 聚类

1.2.3 关联

1.2.4.回归

1.2.5 预测

1.2.6 序列分析

1.2.7 偏差分析

1.3 数据挖掘项目的生命周期

1.3.1 商业问题的形成

1.3.2 数据收集

1.3.3 数据清理和转换

1.3.4 模型构建

1.3.5 模型评估

1.3.6 报告和预测

1.3.7 应用集成

1.3.8 模型管理

1.4 本章小结

第2章 用MicrosoftExcel2007进行数据挖掘

2.1 表分析工具的安装

2.1.1 配置具有管理权限的AnalysisServices

2.1.2 配置没有管理权限的AnalysisServices

2.1 3使用该插件的要求

2.1.4 寻求帮助

2.2 分析关键影响因素工具

2.2.1 主影响因素报表

2.2.2 区别报表

2.2.3 分析关键影响因素

任务小结

2.3检测类别工具

2.3.1 启动工具

2.3.2 类别报表

2.3.3 检测类别工具小结

2.4 从示例填充工具

2.4.1 运行工具,解释结果

2.4.2 细调结果

2.4 3从示例填充工具小结

2.5 预测工具

2.5.1 启动工具,指定选项

2.5.2 解释结果

2.5.3 预测工具小结

2.6 突出显示异常值工具

2.6.1 使用工具

2.6.2 更复杂的交互操作

2.6.3 限制和故障排除

2.6.4 突出显示异常值工具小结

2.7 应用场景分析工具

2.7.1 目标查找工具

2.7.2 对数字目标使用目标查找工具

2.7.3 对整个表使用目标查找工具

2.7.4 假设工具

2.7.5 对整个表使用假设工具

2.7.6 应用场景分析工具小结

2.8 预测计算器工具

2.8.1 运行工具

2.8.2 细调结果

2.8.3 使用结果

2.8.4 预测计算器工具小结

2.9 购物篮分析工具

2.9.1 使用工具

2.9.2 捆绑销售商品报表

2.9 3购物篮推荐报表

2.9.4 调整工具

2.9.5 购物篮分析工具小结

2.10 表分析工具的技术概述

2.11 本章小结

第3章 数据挖掘概念与DMX

3.1 DMX的发展历史

3.2 为什么使用DMX

3.3 数据挖掘过程

3.4 关键概念

3.4.1 属性

3.4.2 状态

3.4.3 事例

3.4.4 键

3.4.5 输入和输出

3.5 DMX对象

3.5.1 挖掘结构

3.5.2 挖掘模型

3.6 DMX查询语法

3.6.1 创建挖掘结构

3.6.2 创建挖掘模型

3.6.3 填充挖掘结构

3.7 预测

3.7.1 预测连接

3.7.2 预测查询语法

3.7.3 预测函数

3.7.4 嵌套表上的预测

3.7.5 预测嵌套值列

3.8 本章小结

第4章 使用SQLServer进行数据挖掘

4.1 BIDevStudio介绍

4.1.1 用户界面

4.1.2 脱机模式和即时模式

4.1 3创建数据挖掘对象

4.2 设置数据源

4.2.1 数据源

4.2.2 使用数据源视图

4.3 创建和编辑模型

4.3.1 结构和模型

4.3.2 使用数据挖掘向导

4.3.3 创建MovieClick挖掘结构和挖掘模型

4.3.4 使用数据挖掘设计器

4.4 处理

4.5 使用模型

4.5.1 了解模型查看器

4.5.2 使用挖掘准确性图表

4.5 3为MovieClick模型创建一个提升图

4.5.4 使用交叉验证

4.5.5 使用挖掘模型预测

4.5.6 针对MovieClick模型执行查询

4.5.7 创建数据挖掘报表

4.6 使用SQLServerManagementStudio

4.6.1 了解ManagementStudio用户界面

4.6.2 使用服务器资源管理器

4.6.3 使用对象资源管理器

4.6.4 使用查询编辑器

4.7 本章小结

第5章 使用Office2007执行数据挖掘过程

5.1 数据挖掘客户端简介

5.2 用数据挖掘客户端导入数据

5.3 数据浏览和准备

5.3.1 用浏览数据工具离散数据

5.3.2 砍掉长长的尾巴

5.3.3 合并多个含义

5.3.4 去除不合逻辑的值

5.3.5 配平数据

5.4 建模

5.4.1 基于任务的建模

5.4.2 数据挖掘客户端中的高级建模

5.5 准确性和验证

5.6 模型用法

5.6.1 浏览模型

5.6.2 用Visio查看模型

5.6.3 查询模型

5.6.4 查询向导

5.7 数据挖掘单元格函数

5.7.1 DMPREDICT函数

5.7.2 DMPREDICTTABLEROW函数

5.7.3 DMCONTENTQUERY函数

5.8 管理模型

5.9 跟踪

5.10 本章小结

第6章 Microsoft贝叶斯算法

6.1 贝叶斯算法介绍

6.2 使用贝叶斯算法

6.2.1 创建预测模型

6.2.2 数据浏览

6.2.3 关键影响因子的分析

6.2.4 文档分类

6.2.5 DMX

6.2.6 理解贝叶斯模型的内容

6.2.7 浏览贝叶斯模型

6.3 理解贝叶斯算法的基本原理

6.4 贝叶斯算法的参数

6.4.1 MAXIMUM_INPUT_ATTRIBUTES

6.4.2 MAXIMUM_OUTPUT_ATTRIBUTES

6.4.3 MAXIMUN_STATES

6.4.4 MINIUMUM-DEPENDENC_PROBABILITY

6.5 本章小结

第7章 Microsoft决策树算法

7.1 决策树算法介绍

7.2 使用决策树算法

7.2.1 创建决策树模型

7.2.2 DMX查询

7.2.3 模型内容

7.2.4 解释模型

7.3 决策树算法的基本原理

7.3.1 决策树生成的基本思想

7.3.2 处理变量中的多个状态

7.3.3 避免过度训练

7.3.4 结合先验知识

7.3.5 特征选择

7.3.6 使用连续的输入属性

73.7 回归

7.3.8 使用Microsoft决策树算法进行关联分析

7.4 算法参数

7.4.1 ComplexityPenalty

7.4.2 MmimumSuppot

7.4.3 Score-Method

7.4.4 SplitMethod

7.4.5 MaximumInputAttribute

7.4.6 MaximumOutputAtmbute

7.4.7 ForceRegressor

7.5 存储过程

7.6 本章小结

第8章 Microsoft时序算法:

8.1 Microsoft时序算法介绍

8.2 用法

8.3 DNⅨ

8.3.I模型的创建

8.3.2 模型的处理

8.3.3 预测

8.3.4 钻取功能

8.4 Microsoft时序算法的基本原理

8.4.1 自动回归

8.4.2 周期

8.4.3 自动回归树

8.4.4 预测

8.5 参数

8.5.1 MissingValueSutitution

8.5.2 PeriodicityHint

8.5.3 AutoDetectPeriodicity

8.5 4Minimum-Series-Value和Maximum-Series-Value

8.5.5 ForecastMethod

8.5.6 PredictionSmoothing

8.5.7 InstabilitySensitivity

8.5.8 Historic-Model-Count和HistoricModelGap

8.5.9 ComplexityPenalty和MinimumSupport

8.6 模型的内容

8.7 本章小结

第9章 Microsoft聚类算法

9.1 Microsoft聚类算法介绍

9.2 使用聚类模型

9.2.1 进行聚类

9.2.2 将聚类作为一个分析步骤

9.2 -3利用聚类检查异常

9.2.4 DN

9.2.5 模型内容

9.2.6 理解聚类模型

9.3 聚类算法的基本原理

9.3.1 硬聚类算法与软聚类算法

9.3.2 离散聚类

9.3.3 可伸缩聚类

9.3.4 聚类预测

9.4 聚类算法的参数

9.4.1 ClusteringMethod

9.4.2 Cluster-Count

9...4 3Minimum-Cluster-Cases

9.4.4 ModellingCardinality

9.4.5 StoppingTolerance

9.4 6Sample-Size

9.4.7 Cluster-Seed

9.4.8 MaximumInputAttributes

9.4.9 Maximum-States

9.5 本章小结

第10章 Microsoft序列聚类算法

10.1 Microsoft序列聚类算法介绍

10.2 使用Microsoft序列聚类算法

10.2.1 创建序列聚类模型

10.2.2 DMX查询

10.2.3 解释模型

10.3 Microsoft序列聚类算法的基本原理

10.3.1 什么是马尔可夫链

10.3.2 马尔可夫链的阶

10.3.3 状态转移矩阵

10.3.4 使用马尔可夫链来进行聚类

10.3.5 聚类分解

10.4 模型内容

10.5 序列聚类算法的参数

10.5.1 Cluster-Count

10.5.2 MinimumSupport

10.5.3 Maximum-States

10.5.4 MaximumSequence-States

10.6 本章小结

……

第11章 Microsoft关联规则算法

第12章 Microsoft神经网络算法和逻辑回归算法

第13章 挖掘OLAP立方体

第14章 SQLServer集成服务数据挖掘

第15章 SQLServer数控挖掘的体系结构

第16章 SQLServer数据挖掘编程

第17章 扩展SQLServer数据挖掘

第18章 实现Web交叉销售应用程序

第19章 总结与其他资源

内容摘要:

  SQL Server数据挖掘是业界使用最广泛的数据挖掘服务器。企业用户(甚至学术专家和科学家)都采用SQL Server数据挖掘技术,因为这种技术的可伸缩性很强,容易获得,功能广泛,并且易于使用。
  SQL Server的2008版本在数据挖掘方面有了令人兴奋的新改进,本书是SQL Server数据挖掘方面的经典之作,介绍了如何掌握最新功能,是部署和使用SQL Server数据挖掘技术的实用指南。
  本书的作者团队首先介绍了使用SQL Server 2008数据挖掘所需的工具、技术和概念,然后全面讨论了SQL Server 2008数据挖掘算法的细节,以及如何把SQL Server数据挖掘技术与SQL Server Business Intelligence(BI)套件的其他部分集成起来,扩展SQL Server数据挖掘技术,以满足自己的需要。本书中详尽而实用的示例清晰地解释了如何利用SQL Server 2008构建成功的数据挖掘解决方案。

编辑推荐:

  SQL Server数据挖掘是业界使用最广泛的数据挖掘服务器。企业用户(甚至学术专家和科学家)都采用SQL Server数据挖掘技术,因为这种技术的可伸缩性很强,容易获得,功能广泛,并且易于使用。
  SQL Server的2008版本在数据挖掘方面有了令人兴奋的新改进,《数据挖掘原珲与应用(第2版)——SQL Server 2008数据库是SQL Server数据挖掘方面的经典之作,介绍了如何掌樨最新功能,是部署和使用SQL Server数据挖掘技术的实用指南。
  数据挖掘原珲与应用(第2版)——SQL Server2008数据库》的作者团队首先介绍了使用SQLServer2008数据挖掘所需的工具、技术和概念,然后全面讨论了SQLServer2008数据挖掘算法的细节,以及如SQL Server数据挖掘技术与SQL Server Business Intelligence(BI)套件的其他部分集成起来,扩展SQL erver数据挖掘技术,以满足自己的需要。《数据挖掘原理与应用(第2版):SQL Server 2008数据库》中详尽而实用的示例清晰地解释了如何利用SQL Server2008年建成功的数据挖掘解决方案。使用Microsoft Excel实现数据挖掘解决方案使用Microsoft Office的数据挖掘插件理解应用SQL Server数据挖掘技术中的各种算法的方式、时间和场合在联机分析处理(OLAP)立方体中进行数据挖掘实现自己的数据挖掘算法和存储过程,以扩展SQL Server数据挖掘技术使用SQL Server Management Studio访问和保护数据挖掘对象使用SQL Server Business Intelligence Development Studio创建和管珲数据挖掘项目。

书籍规格:

书籍详细信息
书名数据挖掘原理与应用站内查询相似图书
9787302228424
如需购买下载《数据挖掘原理与应用》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位清华大学出版社
版次1版印次1
定价(元)58.0语种简体中文
尺寸26 × 19装帧平装
页数印数

书籍信息归属:

数据挖掘原理与应用是清华大学出版社于2010.5出版的中图分类号为 TP311.138 的主题关于 关系数据库-数据库管理系统,SQL Server 2008-教材 的书籍。