SAS统计分析与数据挖掘

SAS统计分析与数据挖掘

谢龙汉, 尚涛, 编著

出版社:电子工业出版社

年代:2011

定价:56.0

书籍简介:

本书基于SAS 9.2版本编写,从SAS编程出发,用案例形式介绍SAS数据挖掘在各领域的广泛应用,分为SAS基础篇、提高篇及应用篇,每章均给出大量分析案例。内容有:SAS软件与数据挖掘简介、SAS编程基础、图形与报表制作、描述性分析、假设检验、回归分析、方差分析与因子分析、相关分析与对应分析、判别分析、聚类分析、生存分析、时间序列分析、Monte Carlo模拟,以及SAS在具体数据挖掘项目中的应用,面向企业级用户的SAS EM软件系统简介。配套光盘中有实例的操作视频以及相关源程序文件。

书籍目录:

第1章 数据挖掘概述

1.1 数据挖掘简介

1.1.1 数据挖掘的含义

1.1.2 数据挖掘的起源

1.1.3 统计学与数据挖掘

1.1.4 数据挖掘相关的一些问题

1.2 数据挖掘用途

1.3 数据挖掘过程

1.3.1 数据挖掘用户

1.3.2 数据挖掘工具

1.3.3 数据挖掘步骤

1.4 SAS--数据挖掘领域的领导者

1.5 SAS在各种商业解决方案中的应用

1.5.1 SAS数据挖掘技术的实现

1.5.2 SAS在商业领域中的应用

第2章 SAS模块概述

2.1 SAS简介

2.1.1 SAS的设计思想

2.1.2 SAS的功能

2.1.3 SAS的特点

2.2 SAS软件安装、启动与退出

2.2.1 SAS软件的安装

2.2.2 SAS软件的启动

2.2.3 SAS软件的退出

2.3 SAS界面

2.3.1 Explorer窗口

2.3.2 Editor窗口

2.3.3 Results窗口

2.3.4 Log窗口

2.3.5 Output窗口

2.4 SAS模块介绍

2.4.1 SAS/BASE模块

2.4.2 SAS/ANALYSIS模块

2.4.3 SAS/ASSIST模块

2.4.4 SAS/INSIGHT模块

2.4.5 SAS/EM模块

第3章 SAS程序设计基础

3.1 SAS编程基础

3.1.1 SAS语言基础

3.1.2 SAS语言构成

3.1.3 SAS结构化编程语句

3.1.4 SAS程序编写规则

3.2 SAS程序的数据步

3.2.1 DATA语句

3.2.2 INPUT语句

3.2.3 CARDS与CARDS4语句

3.2.4 INFILE语句

3.2.5 SET语句

3.2.6 MERGE语句

3.3 SAS数据步循环与转移控制

3.3.1 IF语句

3.3.2 SELECT语句

3.3.3 DO语句

3.3.4 GO TO语句

3.3.5 RETURN语句

3.3.6 CONTINUE语句与LEAVE语句 59

3.3.7 如何跳出选择结构和循环体

3.4 SAS程序的过程步

3.4.1 SAS过程步用法

3.4.2 VAR与MODLE语句

3.4.3 ID与WHERE语句

3.4.4 BY与CLASS语句

3.4.5 OUTPUT语句

3.4.6 FERQ与WEIGHT语句

3.4.7 LABEL与FORMAT语句

3.5 SAS函数

3.5.1 数学函数

3.5.2 数组函数

3.5.3 日期时间函数

3.5.4 概率分布函数

3.5.5 分位数函数

3.5.6 样本统计函数

3.5.7 随机函数

第4章 数据预处理

4.1 数据输入

4.1.1 原始数据的读取

4.1.2 数据导入

4.2 数据整理

4.2.1 数据集选项

4.2.2 整理数据集

4.2.3 缺失值处理

4.2.4 UPDATE语句更新数据集

4.2.5 数据清洗

4.3 数据步变量控制

4.3.1 ARRAY语句

4.3.2 INFORMAT语句与FORMAT语句

4.3.3 LABEL语句

4.3.4 ATTRIB语句

4.3.5 DROP语句与KEEP语句

4.3.6 RENAME语句与RETAIN语句

4.4 数据修改与选择

4.4.1 赋值语句

4.4.2 累加语句

4.4.3 DELETE语句与LOSTCARD语句

4.4.4 STOP语句与ABORT语句

4.4.5 WHERE语句

4.4.6 REMOVE语句与REPLACE语句

4.4.7 MISSING语句

第5章 数据汇总与报表制作

5.1 使用过程PRINT制作报表

5.1.1 基本用法

实例5-1 PROC PRINT操作实例

5.1.2 使用中文列标题

实例5-2 修改标题实例

5.1.3 标题和脚注

实例5-3 修改标题实例

5.1.4 用BY语句分组处理

5.2 使用过程TABULATE制作汇总报表

实例5-4 汇总报表实例

实例5-5 绘制统计量表格

第6章 SAS绘图

6.1 GPLOT过程

实例6-1 GPLOT过程绘制图形编程操作

6.2 GCHART过程

实例6-2 GCHART过程绘制条形图

实例6-3 GCHART过程绘制GDP数据的BLOCK图形

6.3 G3D过程

实例6-4 绘制二维正态分布曲面图形

实例6-5 绘制函数的三维图形

第7章 数据描述

7.1 统计图

7.1.1 直方图

实例7-1 GCHART过程绘制直方图

7.1.2 条形图

实例7-2 GCHART过程绘制条形图

7.1.3 散点图

实例7-3 GPLOT过程绘制散点图

7.1.4 饼图

实例7-4 GCHART过程绘制饼图

7.1.5 盒形图

实例7-5 BOXPLOT过程绘制盒形图

7.1.6 茎叶图

实例7-6 UNIVARIATE过程绘制茎叶图

7.1.7 时间序列图

实例7-7 TIMEPLOT过程绘制时间序列图

7.2 统计量

7.2.1 集中趋势

实例7-8 利用MEAN函数求平均数

7.2.2 离散程度

实例7-9 利用函数VAR和STD求方差和标准差

7.2.3 分布状态

实例7-10 利用SKEWNESS 和KURTOSIS函数求偏度和峰度

7.3 数据分布

实例7-11 SAS中的部分概率分布函数的应用

第8章 描述性统计分析

8.1 SAS编程进行统计分析

8.1.1 基本概念

8.1.2 FREQ过程

实例8-1 频数表的生成实例

实例8-2 绘制实验数据表格

8.1.3 MEANS过程

实例8-3 求平均增长率

实例8-4 利用MEANS过程求各种统计量

8.1.4 UNIVARIATE过程

实例8-5 利用UNIVARIATE过程求各种统计量

实例8-6 求样本的极差、上四分位和下四分位数

8.1.5 TABULATE过程

实例8-7 制作数据表格

8.2 其他描述性统计过程

8.2.1 产生描述性统计值的输出文件:PROC SUMMARY

实例8-8 SUMMARY语句实例

8.2.2 统计值的图形表示:PROC CHART

实例8-9 绘制数据分布图形

实例8-10 利用CHART过程的VBAR及HBAR命令绘制条形图

8.2.3 一般制图:PROC PLOT

实例8-11 PLOT过程绘制图形

第9章 ANALYST模块

9.1 ANALYST模块概述

9.1.1 ANALYST模块简介

9.1.2 ANALYST菜单介绍

9.2 数据集的窗口操作

9.2.1 数据集输入

9.2.2 数据表修改

9.2.3 数据保存

9.3 绘制统计图

9.3.1 条形图

9.3.2 饼图

9.3.3 散点图

9.4 统计分析

第10章 参数估计与假设检验

10.1 参数估计和假设检验概述

10.1.1 参数估计

10.1.2 假设检验

10.2 假设检验的SAS过程

10.2.1 UNIVARIATE过程

10.2.2 MEANS过程

10.2.3 TTEST过程

10.3 不同类型的均值和方差的检验

10.3.1 单变量均值t检验

实例10-1 TTEST过程的实例数据分析

实例10-2 总体均值检验

10.3.2 样本均数与总体均数差异的t检验

实例10-3 均值的显著性差别检验

10.3.3 配对资料的t检验

实例10-4 乳酸饮料实验数据的配对t检验

实例10-5 均值有无差异的检验

10.3.4 两样本均数比较的t检验

实例10-6 均数差别的显著性检验

实例10-7 数据比例的显著性检验

10.4 正态性检验

实例10-8 样本数据的正态性检验实例1

实例10-9 样本数据的正态性检验实例2

第11章 方差分析与协方差分析

11.1 方差分析的基本原理

11.1.1 自由度与平方和分解

11.1.2 F检验

11.2 单因素方差分析

11.2.1 单因素方差分析步骤

11.2.2 判断与结论

11.2.3 ANOVA过程

实例11-1 分析饲料营养效果是否有明显差异

实例11-2 分析不同实验室试制的纸张光滑度有无差异

实例11-3 研究6种棉花种子包衣剂对棉花生长的影响

11.3 双因素方差分析

11.3.1 只考虑主效应的多因素方差分析

11.3.2 存在交互效应的多因素方差分析

实例11-4 某药物对某癌细胞株增殖影响的研究

11.4 协方差分析

实例11-5 分析三种饲料的营养价值之间有无显著性差别

第12章 回归分析

12.1 线性回归

12.1.1 线性回归模型

12.1.2 回归方程的显著性检验

12.1.3 预测问题

12.2 REG过程

实例12-1 分析我国内地可支配收入和消费性支出之间的关系

实例12-2 利用多元线性回归分析学生肺活量及有关变量的关系

12.3 多项式回归

12.3.1 曲线回归的基本原理

12.3.2 RSREG过程

实例12-3 确定最佳经济用肥量的多项式回归模型

12.4 逐步回归

实例12-4 人体血糖、胰岛素及生长素的多元线性回归关系

12.5 LOGISTIC回归

12.5.1 逻辑回归模型概述

12.5.2 LOGISTIC过程

实例12-5 对照研究单因素两暴露水平及多暴露水平资料的统计分析

12.6 非线性回归

12.6.1 非线性回归分析的基本原理

12.6.2 NLIN过程

实例12-6 酵母种群增长的拟合生长模型

实例12-7 最佳生长模型的LOGISTIC拟合

第13章 主成分分析与因子分析

13.1 主成分分析

13.1.1 主成分分析的数学原理

13.1.2 用PRINCOMP过程进行主成分分析

实例13-1 我国2006年经济发展情况的主成分分析

13.2 因子分析

13.2.1 因子分析的基本原理

13.2.2 因子分析的基本步骤和过程

13.2.3 利用FACTOR过程进行因子分析

实例13-2 中国房地产经济区的研究分析

13.3 主成分分析和因子分析的区别

第14章 相关分析和对应分析

14.1 相关分析

14.1.1 相关关系

14.1.2 相关图形和相关系数

14.1.3 简单相关分析的CORR过程

实例14-1 简单相关系数的计算

14.2 典型相关分析

14.2.1 典型相关分析的基本原理

14.2.2 典型相关分析的CANCORR过程

实例14-2 城市竞争力与基础设施的典型相关分析

实例14-3 城镇居民收入和支出的典型相关分析

14.3 对应分析

14.3.1 对应分析的基本原理

14.3.2 对应分析的CORRESP过程

实例14-4 对应分析在市场细分中的应用

第15章 判别分析

15.1 判别分析的基本原理

15.1.1 判别分析的含义

15.1.2 判别分析的数学模型与判别方法

15.2 判别分析的SAS过程

15.2.1 DISCRIM过程

15.2.2 CANDISC过程

15.2.3 STEPDISC过程

15.3 综合实例

实例15-1 国内各省市农民家庭收支情况的研究

实例15-2 基于判别分析法的上市公司财务分析研究

第16章 聚类分析

16.1 聚类分析的基本原理

16.1.1 聚类的数学原理

16.1.2 SAS中的聚类过程

16.2 聚类分析的步骤和过程

16.2.1 CLUSTER过程(系统聚类过程)

实例16-1 中国城镇居民消费结构的聚类分析

16.2.2 FASTCLUS过程(快速聚类过程)

实例16-2 聚类分析在客户定位中的应用研究

16.2.3 VARCLUS过程(变量聚类过程)

实例16-3 变量聚类在多指标系统评价中的应用

16.2.4 TREE过程(画树状图过程)

实例16-4 对全球各国信息设施的发展情况进行聚类分析研究

第17章 生存分析

17.1 生存分析基本概述

17.1.1 生存分析的基本概念

17.1.2 生存资料的特点

17.1.3 生存分析方法

17.2 生存分析的LIFETEST过程

实例17-1 生存分析在医学课题研究中的应用

17.3 COX模型回归分析

17.3.1 COX回归模型

17.3.2 PHREG过程

实例17-2 COX模型的分析应用

第18章 时间序列分析

18.1 时间序列概述

18.1.1 时间序列的组成部分

18.1.2 时间序列的数学模型

18.1.3 时间序列的因素分析

18.1.4 随机时间序列分析

18.1.5 时间序列的分析步骤

18.2 SAS的ARIMA过程

18.3 综合实例

实例18-1 化工生产数据的时间序列分析

实例18-2 国内金融及保险业每人每月平均薪资趋势分析

实例18-3 运用ARIMA过程对上证指数日线数据进行拟合分析

第19章 SAS数据挖掘应用

19.1 SAS数据挖掘

19.2 SAS数据挖掘方法论--SEMMA

19.2.1 数据取样

19.2.2 数据探索

19.2.3 问题明确化、数据调整和技术选择

19.2.4 模型研发

19.2.5 模型评估

19.3 数据挖掘套件SAS/EM

实例19-1 SAS/EM聚类分析

实例19-2 购物篮问题分析

第20章 SAS在数据预测中的应用

20.1 数据预测简介

20.1.1 数据预测

20.1.2 SAS中的预测分析模块

20.2 数据预测案例分析

实例20-1 国民生产总值的预测

实例20-2 SAS/Time Series Forecasting System模块应用

第21章 SAS在金融数据分析中的应用

21.1 现金流贴现分析

实例21-1 现金流贴现的计算

实例21-2 企业现金流的贴现计算

实例21-3 利用金融函数compound计算复利率

21.2 股票分类

实例21-4 利用CLUSTER过程对股票进行聚类分析

21.3 资本资产定价模型(CAPM模型)

实例21-5 CAPM模型实例研究

21.4 B-S模型期权定价

实例21-6 B-S期权定价的SAS程序实现

内容摘要:

《SAS统计分析与数据挖掘》基于SAS 9.2版本编写,从SAS编程出发,用案例形式介绍SAS数据挖掘在各领域的广泛应用,全书分为SAS基础篇、提高篇及应用篇,每章均给出大量分析案例。具体内容为SAS软件与数据挖掘简介,SAS编程基础,图形与报表制作,描述性分析,假设检验,回归分析,方差分析与因子分析,相关分析与对应分析,判别分析,聚类分析,生存分析,时间序列分析,以及SAS在具体数据挖掘项目中的应用等。
《SAS统计分析与数据挖掘》最大特点是抛弃了其他同类书籍中只说理论、缺少案例分析的弊病,全书给出大量数据挖掘分析案例,为读者展示SAS在数据整合、数据挖掘、商业智能、金融数据分析、金融风险管理等项目中的强大应用技术。
配套光盘中有实例的操作视频以及相关源程序文件。

编辑推荐:

《SAS统计分析与数据挖掘》适合高等院校、科研单位的统计、信息等相关专业的本科生、研究生、科技人员和企事业单位计算机工作者,以及数据分析、商业咨询、金融工程、商业智能工作者。

书籍规格:

书籍详细信息
书名SAS统计分析与数据挖掘站内查询相似图书
丛书名工程设计与分析系列
9787121148880
如需购买下载《SAS统计分析与数据挖掘》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位电子工业出版社
版次1版印次1
定价(元)56.0语种简体中文
尺寸26 × 18装帧平装
页数 440 印数

书籍信息归属:

SAS统计分析与数据挖掘是电子工业出版社于2011.11出版的中图分类号为 C819 的主题关于 统计分析-应用软件,SAS 的书籍。