SAS数据挖掘与分析

SAS数据挖掘与分析

周爽, 朱秀萍, 阮桂海, 编著

出版社:清华大学出版社

年代:2008

定价:28.0

书籍简介:

本书介绍数据挖掘与统计分析所需要的各类命令语句,以及如何来实现统计和分析。

书籍目录:

第1章 SAS编程的语法知识

1.1 SAS(StatisticalAnalysisSystem)概述

1.2 观测值、变量常量

1.3 SAS的操作符

1.4 SAS数据挖掘常用的语句

习题

第2章 数据挖掘的预备知识

2.1 DATA语句

2.2 INPUT语句

2.3 LENGTH语句

2.4 用LABEL语句指定变量标签

2.5 用PROCFORMAT过程指定数据标签

2.6 用MISSING语句宣告缺失值

2.7 注释语句

2.8 创建新变量

2.9 缺失值不参与运算

2.1 0求和语句

2.1 1删除变量

2.1 2用INFILE语句读取外部文件的数据

习题

第3章 数据挖掘时的跳转与循环

3.1 IF语句

3.1.1 IFTHEN语句

3.1.2 IFTHEN/ELSE语句

3.2 GOTO语句

3.3 LINK语句

3.4 RETURN语句

3.5 删除部分个案

3.5.1 删除数据集里暂时不用的个案

3.5.2 用IF语句挖掘部分数字型的个案

3.6 循环语句

3.7 数组

3.7.1 下标变量的下标

3.7.2 在DOEND循环中使用数组

3.7.3 多维数组

习题

第4章 建立数据仓库

4.1 建立永久数据集

4.2 数据的分组及分组标记

4.2.1 分组控制

4.2.2 数据的分组标记

4.3 数据的排序

4.4 数据集的连接

4.4.1 变量相同时的连接

4.4.2 变量不同时的连接

4.4.3 变量值相同时的个案连接

4.5 数据集合二而一

4.5.1 按个案号配对合并变量

4.5.2 用BY语句进行匹配合并

4.6 用FILE语句控制输出文件

4.7 OUTPUT语句

4.7.1 OUTPUT语句格式

4.7.2 一个个案的变量分几行输出

4.7.3 一个DATA步创建多个数据集

4.8 用DATASETS过程修改数据集

4.9 查阅数据集的信息

习题

第5章 数据挖掘的过程引论

5.1 DATA语句

5.2 INFILE语句

5.3 INPUT语句

5.3.1 用INPUT语句定义固定格式的变量

5.3.2 用INPUT语句定义自由格式的变量

5.3.3 用INPUT语句指定格式化的输入方式

5.3.4 INPUT语句含有挖掘功能

5.4 用LABEL语句定义变量标签

5.5 用FORMAT及VALUE语句定义数值标签

5.5.1 定义数值标签

5.5.2 指定格式化输入

5.5.3 用FORMAT语句指定变量值的格式

5.6 用TITLE语句显示标题

5.7 数据挖掘常用的统计过程

5.7.1 用PROCFREQ过程做简单的频数分布

5.7.2 用PROCCHART过程画图

5.7.3 用PROCPLOT过程画散点图

5.7.4 用PROCMEANS过程统计均值分布

5.7.5 用PROCRANK过程统计秩和分布

5.7.6 用PROCTABULATE制表

5.7.7 用PROCUNIVARIATE过程做详尽的频数分布

5.7.8 用PROCDBF过程调用dBASE数据库数据

5.7.9 用PROCPRINT过程显示数据集的信息

5.7.1 0用PROCSORT过程对数据排序

5.7.1 1用PROCSTANDARD过程对变量标准化

5.5.1 2用TRANSPOSE过程转置数据

习题

第6章 通过描述统计挖掘数据

6.1 用FREQ过程做单双变量的频数统计

6.1.1 FREQ过程命令

6.1.2 FREQ过程与其他过程的连用

6.2 单变量频数分布

6.3 双变量交叉汇总和结合测量

6.3.1 双变量频数统计的过程命令

6.3.2 定类-定类双变量交叉汇总与结合测量

6.3.3 定比-定比双变量交叉汇总与结合测量

6.3.4 定序-定序双变量交叉汇总与结合测量

6.4 再用UNIVARIATE过程详细描述单变量

6.4.1 举例

6.4.2 UNIVARIATE过程命令

6.4.3 计算方法

6.5 进一步用PROCCHART过程描述单变量

6.5.1 PROCCHART过程命令

6.5.2 CHART的选项

6.6 用MEANS过程比较两个均值

6.6.1 应用实例

6.6.2 MEANS过程命令

6.7 用PROCPLOT过程画散点图

6.8 用RANK过程进行非参数检验

6.8.1 什么是秩分

6.8.2 RANK过程命令

6.8.3 秩分计算

6.8.4 运用举例

习题

第7章 均值比较与T检验

7.1 均值比较的方法

7.1.1 配对样本的均值比较

7.1.2 两个独立样本的均值差检验

7.2 MEANS过程及其t统计量

7.3 TTEST过程及其t检验

7.4 非参数检验

7.4.1 用NPAR1WAY过程做非参数检验

7.4.2 举例

习题

第8章 方差分析

8.1 用ANOVA做均衡数据的方差分析

8.1.1 ANOVA过程命令

8.1.2 单因素方差分析

8.1.3 双因素方差分析

8.1.4 三因素方差分析

8.1.5 R*C交互因素的方差分析

8.1.6 多个实验组与对照组的均值比较

8.1.7 用SNK的Q检验法比较组间均值

8.2 用GLM进行非均衡数据方差分析

8.2.1 GLM过程命令

8.2.2 GLM过程的统计功能

8.2.3 用GLM做单因素3水平方差分析

8.2.4 用GLM做二因素方差分析

8.3 协方差分析

8.3.1 GLM过程命令

8.3.2 用GLM做协方差分析

习题

第9章 相关分析

9.1 数据的4种测量水平

9.2 皮尔逊积差相关

9.2.1 皮尔逊相关系数CORR的计算公式

9.2.2 皮尔逊相关系数的测量

9.2.3 皮尔逊相关系数CORR的分析

9.3 皮尔逊二分点-距相关

9.4 肯氏(Kendall)等级相关τb

9.4.1 计算肯氏等级相关系数的数据

9.4.2 通过Analyst中的对话框计算肯氏相关系数τb

9.4.3 肯氏相关系数τb结果分析

9.5 计算次序-比率数据的肯氏相关系数

9.5.1 次序-比率数据例子

9.5.2 计算次序-比率数据的Eta系数

9.5.3 肯氏相关系数τb结果分析

9.6 斯皮尔曼等级相关

9.6.1 斯皮尔曼等级相关系数的计算公式

9.6.2 用分析家对话框测量等级相关

9.6.3 Spearman相关系数的分析

9.7 标称-标称型变量的相关测量

9.8 Cronbach的Alpha系数与Spearman相关系数

9.9 用PROCCORR过程编程计算相关系数

习题

第10章 用GLM过程进行回归分析

10.1 最小平方法的原理

10.1.1 方差分析

10.1.2 统计量F

10.1.3 回归系数Β计算法

10.1.4 判定系数R

10.1.5 残差分析

10.1.6 DW统计量D

10.2 GLM中各语句的格式

10.3 GLM程序各语句的使用说明

10.4 调用GLM程序作一元线性回归

10.4.1 数据与程序

10.4.2 数据分析

10.4.3 结果分析

10.5 调用GLM程序进行多元线性回归分析

10.6 调用GLM程序进行多项式回归

10.6.1 多项式回归的一般模型

10.6.2 多项式回归的实例

10.7 虚拟变量的用法

习题

第11章 采用REG过程进行多元线性回归分析

11.1 用Analyst对话框做多元线性回归

11.2 REG过程的语句格式

11.2.1 REG程序中的语句及任选项

11.2.2 REG程序中主要语句及关键词的注解

11.3 REG程序进一步实例

11.4 MAXR回归法和RSQUARE回归法

11.4.1 MAXR回归法

11.4.2 RSQUARE回归法

11.4.3 实用程序及图例

习题

第12章 路径分析

12.1 路径分析所用的程序

12.2 图形输出

12.3 路径图的分析方法

习题

第13章 生存分析

13.1 名词引论

13.2 用LIFEREG进行生存分析

13.2.1 LIFEREG过程命令

13.2.2 LIFEREG过程的应用实例

13.3 用LIFETEST过程进行生存检验

习题

第14章 非线性回归分析一:对数与多项式回归

14.1 对数曲线回归

14.1.1 对数曲线回归所要求的数据

14.1.2 对数曲线回归的编程解法

14.2 对数曲线回归分析

14.3 拟合抛物线的多项式回归

14.3.1 多项式回归分析的原始数据

14.3.2 多项式回归的方程式

14.3.3 多项式回归的SAS程序

14.4 多项式回归的结果与分析

14.4.1 多项式回归的输出结果

14.4.2 改用分析家对话框法进行多项式回归

14.4.3 拟合大学生生长发育的二次曲线模型

习题

第15章 非线性回归二:Logistic回归与指数回归

15.1 Logistic曲线回归

15.2 从Logistic曲线模型解出初始值

15.3 拟合Logistic曲线回归的分析

15.3.1 参数估计

15.3.2 参数近似的置信区间

15.3.3 用Logistic曲线预测人口

15.4 负指数生长曲线回归

15.5 分析负指数生长曲线

15.6 拟合指数曲线Y=AeBX回归

15.6.1 建立指数曲线Y=AeBX的回归模型

15.6.2 分析指数曲线Y=AeBX回归结果

15.6.3 指数曲线的预测

习题

第16章 用Logistic过程做逻辑斯蒂克回归

16.1 逻辑斯蒂克回归模型

16.2 Logistic回归过程对数据的要求

16.3 用分析家对话框做Logistic回归

16.4 用编程法做逻辑斯蒂克回归

16.5 假设与检验

16.6 解释回归系数

16.7 概率预测

16.8 多分变量的编码

习题

第17章 2*2维LogisticRegression回归分析

17.1 2*2维LogisticRegression模型

17.2 2*2维LogisticRegression的变量及其数据

17.3 用分析家对话框进行2*2维Logistic回归

17.4 2*2维Logistic回归分析

习题

内容摘要:

本教材囊括了SAS编程方面极为详尽的命令语句,是数据的科学挖掘和统计分析方面的一本不可多得的教科书。本书的前8章介绍了数据挖掘和统计分析所用的各类命令语句,第9~17章着重介绍如何用命令语句及其对话框进行常用的初高级统计和专业统计,并对统计结果进行了科学准确的分析。本书面向全国高校统计学、医学、心理学、市场营销学、人文社会学、信息管理学及财经学等专业的本科生和研究生,可作为这些专业及其他非计算机专业学生必选的统计教材,也是数据挖掘和信息分析方面的利器。

编辑推荐:

《高等院校信息技术规划教材:SAS数据挖掘与分析》是教据的科学挖掘和统计分析方面一本不可多得的教材,前半部分介绍了各种数据挖掘和统计分析所用的各类命令语句,后半部分着重介绍如何用命令语句及其对话框进行常用的初高级统计和专业统计,并对统计结果进行既科学又准确的分析,后半部分融会了作者在数据挖掘和信息分析领域教学和研究的经验与成果,是《高等院校信息技术规划教材:SAS数据挖掘与分析》的精华所在。

书籍规格:

书籍详细信息
书名SAS数据挖掘与分析站内查询相似图书
9787302169208
如需购买下载《SAS数据挖掘与分析》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位清华大学出版社
版次1版印次1
定价(元)28.0语种简体中文
尺寸26装帧平装
页数 330 印数 4000

书籍信息归属:

SAS数据挖掘与分析是清华大学出版社于2008.出版的中图分类号为 TP274 的主题关于 数据采集-统计分析-应用软件,SAS-高等学校-教材 的书籍。