数据分析与R

数据分析与R

韩忠明, 段大高, 著

出版社:北京邮电大学出版社

年代:2014

定价:40.0

书籍简介:

信息系统、互联网、移动通信等的快速发展催生了海量的数据。从数据中分析、挖掘隐藏在其中的模式、规律等是发挥数据价值的根本途径。采用有效的工具、方法是分析挖掘数据的基础。R是一个开放、高效的数据分析平台,本书介绍了R的基本功能、数据管理功能、详细描述了R实现各种分析图形的方法。本书详细的介绍了数据分析的整体流程,涵盖了数据获取、数据预处理和常见的数据分析方法。采用R实现了数据主流的数据预处理方法,详细介绍了方差分析、logistic回归、聚类和分类以及用于数据分析的EM算法和MCMC模拟,分析了这些技术的基本原理和实现算法,应用R实现了分析模型与应用过程。本书采用大量真实数据和案例作为驱动,分析了在实际问题中如何利用相关技术解决分析问题。本书适合从事数据分析、数据挖掘等的研究者、应用者参考,也能满足在市场营销、金融、医疗等行业从事数据分析的人士作参考。

书籍目录:

第1章 数据分析基础

1.1 统计基础

1.1.1 概率与统计

1.1.2 统计量与分布

1.1.3 参数估计

1.1.4 假设检验

1.2 软件与开发工具介绍

1.2.1 数据库软件

1.2.2 计算软件

1.2.3 开发软件

第2章 数据预处理

2.1 数据获取

2.2 数据预处理过程

2.3 数据清洗

2.3.1 缺失值处理

2.3.2 重复值处理

2.4 数据集成

2.5 数据变换

2.6 数据规约

第3章 R使用入门

3.1 R的获取和安装

3.2 R的使用

3.3 R的包

3.4 R的数据对象与数据操作

3.5 R数据的导入与导出

3.6 R的条件控制与循环

3.7 R数据预处理

3.8 R的概率分布

第4章 R图形分析

4.1 初始化图形

4.1.1 图形的建立与保存

4.1.2 图形的组合

4.1.3 一个实例

4.2 高级绘图命令

4.3 低级绘图命令

4.4 绘图参数

4.4.1 颜色

4.4.2 文本属性

4.4.3 符号和线条

4.4.4 标题

4.4.5 图例

4.4.6 坐标轴

4.5 图形库

4.5.1 直方图

4.5.2 条形图

4.5.3 散点图

4.5.4 饼图

4.5.5 箱线图

4.5.6 矩阵图

4.5.7 马赛克图

4.5.8 热图

4.5.9 QQ图

4.5.10 平行坐标图

第5章 方差分析

5.1 方差分析的基本过程

5.1.1 单因素方差分析

5.1.2 双因素方差分析

5.2 方差分析的R实现

5.2.1 单因素方差分析R实现

5.2.2 双因素方差分析

5.3 多因素方差分析的R实现

第6章 回归分析

6.1 线性回归模型

6.2 线性回归模型的统计分析

6.3 线性回归分析在R中的实现

6.4 Logistic回归原理

6.5 Logistic模型的求解

6.6 Logistic回归模型的评价和检验

6.7 多Logistic回归的分类与应用

6.8 逐步Logistic回归分析

6.9 Logistic回归的R实践

第7章 聚类与分类分析

7.1 聚类分析

7.2 聚类中的距离度量

7.2.1 连续性数值变量的距离度量方法

7.2.2 离散型属性变量的距离度量方法

7.2.3 R距离度量的实现

7.3 层次聚类法

7.3.1 凝聚式聚类

7.3.2 层次聚类R实现

7.4 K一均值聚类

7.5 数据分类

7.5.1 决策树方法

7.5.2 贝叶斯分类

7.5.3 SVM方法

7.5.4 KNN分类

第8章 EM算法和MCMC方法

8.1 EM算法

8.1.1 初识EM算法

8.1.2 EM算法简述

8.1.3 经典例题

8.1.4 两个重要的定理

8.2 MCMC方法

8.2.1 初识MCMC方法

8.2.2 Metropolis-Hastings方法

8.2.3 Gibbs Sampling方法

内容摘要:

信息系统、互联网、移动通信等的快速发展催生 了海量的数据。从数据中分析、挖掘隐藏在其 中的模式、规律等是发挥数据价值的根本途径。采用 有效的工具、方法是分析挖掘数据的基础。R 是一个开放、高效的数据分析平台,韩忠明、段大高 著的《数据分析与R》介绍了R的基本功能、数据管理 功能、详细描述了R实现 各种分析图形的方法。本书详细地介绍了数据分析的 整体流程,涵盖了数据获取、数据预处理和 常见的数据分析方法。采用R实现了主流的数据预处 理方法,详细介绍了方差分析、Logistic回 归、聚类和分类以及用于数据分析的EM算法和McMC模 拟,分析了这些技术的基本原理和实现 算法,应用R实现了分析模型与应用过程。本书采用 大量真实数据和案例作为驱动,分析了在实 际问题中如何利用相关技术解决分析问题。
  本书既可供从事数据分析、数据挖掘等的研究者 、应用者参考,也可供在市场营销、金融、医疗 等行业从事数据分析的人士参考。

编辑推荐:

数据来源多,数据的异构性强,所以数据预处理对分析结果非常重要,在数据预处理时常用的方法有哪些?如何在R中实现这些数据与处理方法?我们将在韩忠明、段大高著的《数据分析与R》揭晓。 数据复杂性高,高维复杂数据快速产生的同时,也带来大量噪声、异常、非规范的数据。高效的数据分析平台和算法是研究复杂数据的基础,本书将阐述如何利用R实现高效的分析算法。 数据分析的展现,现代数据分析要求数据分析结果有直观的展示。数据分析者是专业人员,而数据分析的用户是领域专家和决策者,充分利用各种直观的图表进行结果展示是数据分析的重要任务。本书将利用R实现数据分析的直观展示。 多学科的融合,现代数据分析融合了计算机科学、统计学、机器学习等不同领域。Logistic回归,EM算法等将会在数据分析中有广阔用武之地。本书将重点研究和实现数据分析中的核心技术以及R实现。 大数据问题。一方面,现代数据分析面临的数据量大、数据复杂性高等问题;另一方面,很多现实问题需要的大量真实数据又难以保证有效获取,所以仿真算法和一些新型模型是解决这个矛盾的一个有效方法。本书将研究和实现MCMC仿真的传统和新算法。

书籍规格:

书籍详细信息
书名数据分析与R站内查询相似图书
9787563540648
如需购买下载《数据分析与R》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位北京邮电大学出版社
版次1版印次1
定价(元)40.0语种简体中文
尺寸26 × 19装帧平装
页数印数

书籍信息归属:

数据分析与R是北京邮电大学出版社于2014.8出版的中图分类号为 O212.1 的主题关于 统计分析 的书籍。