复杂数据统计方法

复杂数据统计方法

吴喜之, 编著

出版社:中国人民大学出版社

年代:2012

定价:39.0

书籍简介:

本书是吴喜之老师近些年来教学经验的结晶,其中涉及大量的非常规数据处理方法,如横截面数据、纵向数据、多元数据等,主要应用的软件是R软件。

作者介绍:

吴喜之,北京大学数学力学系本科,美国北卡罗来纳大学统计博士。中国人民大学统计学院教授,博士生导师。曾在美国加利福尼亚大学、美国北卡罗来纳大学、南开大学、中国人民大学、北京大学等多所著名学府执教。

书籍目录:

第1章引言

1.1作为科学的统计

1.2数据分析的实践

1.3数据的形式以及可能用到的模型

1.3.1横截面数据:因变量为实轴上的数量变量

1.3.2横截面数据:因变量为分类(定性)变量或者频数

1.3.3纵向数据,多水平数据,面板数据,重复观测数据

1.3.4多元数据各变量之间的关系:多元分析

1.3.5路径模型/结构方程模型

1.3.6多元时间序列数据

1.4 r软件入门

1.4.1简介

1.4.2动手

第2章横截面数据:因变量为实数轴上的数量变量

2.1简单回归回顾

第1章引言

1.1作为科学的统计

1.2数据分析的实践

1.3数据的形式以及可能用到的模型

1.3.1横截面数据:因变量为实轴上的数量变量

1.3.2横截面数据:因变量为分类(定性)变量或者频数

1.3.3纵向数据,多水平数据,面板数据,重复观测数据

1.3.4多元数据各变量之间的关系:多元分析

1.3.5路径模型/结构方程模型

1.3.6多元时间序列数据

1.4 r软件入门

1.4.1简介

1.4.2动手

第2章横截面数据:因变量为实数轴上的数量变量

2.1简单回归回顾

2.2简单线性模型不易处理的横截面数据

2.2.1标准线性回归中的指数变换

2.2.2生存分析数据的cox回归模型

2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归

2.2.4无法做任何假定的数据:机器学习回归方法

2.2.5决策树回归(回归树)

2.2.6boosting回归

2.2.7bagging回归

2.2.8随机森林回归

2.2.9人工神经网络回归

2.2.10支持向量机回归

2.2.11几种回归方法五折交叉验证结果

2.2.12方法的稳定性及过拟合

第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况

3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾

3.1.1logistic回归和probit回归

3.1.2经典判别分析

3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法

3.2.1决策树分类(分类树)

3.2.2adaboost分类

3.2.3bagging分类

3.2.4随机森林分类

3.2.5支持向量机分类

3.2.6最近邻方法分类

3.2.7分类方法五折交叉验证结果

3.3因变量为频数(计数)的情况

3.3.1经典的poisson对数线性模型回顾

3.3.2使用poisson对数线性模型时的散布问题

3.3.3零膨胀计数数据的poisson回归

3.3.4使用机器学习的算法模型拟合计数数据

3.3.5多项logit模型及多项分布对数线性模型回顾

第4章纵向数据(多水平数据,面板数据)

4.1纵向数据:线性随机效应混合模型

4.2纵向数据:广义线性随机效应混合模型

4.3纵向数据:决策树及随机效应模型

4.4纵向数据:纵向生存数据

4.4.1cox随机效应混合模型

4.4.2分步联合建模

4.5计量经济学家的视角:面板数据

第5章多元分析(不区分因变量及自变量)

5.1实数轴上的数据:经典多元分析内容回顾

5.1.1主成分分析及因子分析

5.1.2分层聚类及k均值聚类

5.1.3典型相关分析

5.1.4对应分析

5.2非经典多元数据分析:可视化

5.2.1主成分分析

5.2.2对应分析

5.2.3多重对应分析

5.2.4多重因子分析

5.2.5分层多重因子分析

5.2.6基于主成分分析的聚类

5.3多元数据的关联规则分析

第6章路径建模(结构方程建模)数据的pls分析

6.1路径模型概述

6.1.1路径模型

6.1.2路径模型的两种主要方法

6.2 pls方法:顾客满意度的例子

6.3协方差方法简介

6.4结构方程模型的一些问题

第7章多元时间序列数据

7.1时间序列的基本概念及单变量时间序列方法回顾

7.1.1时间序列的一些定义和基本概念

7.1.2常用的一元时间序列方法

7.2单位根及协整检验

7.2.1概述

7.2.2单位根检验

7.2.3协整检验

7.3varx模型与状态空间模型

7.3.1varx模型拟合

7.3.2状态空间模型拟合

7.3.3模型的比较和预测

附录练习:熟练使用r软件

参考文献

内容摘要:

《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。

  《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。

  《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。

书籍规格:

书籍详细信息
书名复杂数据统计方法站内查询相似图书
9787300163994
如需购买下载《复杂数据统计方法》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位中国人民大学出版社
版次1版印次1
定价(元)39.0语种简体中文
尺寸23 × 17装帧平装
页数印数

书籍信息归属:

复杂数据统计方法是中国人民大学出版社于2012.9出版的中图分类号为 C819 的主题关于 统计分析-应用软件-研究生-教材 的书籍。