R数据分析

R数据分析

方匡南, 朱建平, 姜叶飞, 编著

出版社:电子工业出版社

年代:2014

定价:68.0

书籍简介:

本书是一本R语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R语言的基本使用以及编程技巧。本书内容涵盖R数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R包制作等内容。本书的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理,这样能够帮助读者轻松上手学习。

书籍目录:

第 1 章 初识R语言 11.1 什么是R语言 11.2 为什么用R语言 21.3 安装R 41.4 R扩展包 41.4.1 R扩展包的安装与载入 51.4.2 R包的使用 61.5 R编辑器 71.6 工作空间 11第 2 章 数据结构与基本运算 132.1 数据类型 132.2 数据对象 142.2.1 向量 152.2.2 矩阵 212.2.3 数组 312.2.4 因子 322.2.5 列表 332.2.6 数据框 342.3 习题 36第 3 章 函数与优化 383.1 常用的R内置函数 383.2 条件控制语句 383.2.1 if/else语句 383.2.2 ifelse 语句 393.2.3 switch语句 393.3 循环语句 403.3.1 for循环 403.3.2 while循环 403.3.3 repeat语句 413.4 编写自己的函数 413.4.1 函数名 423.4.2 关键词function 423.4.3 参数 423.4.4 函数体和函数返回值 443.5 程序调试 453.6 程序运行时间与效率 463.7 用R做优化求解 473.7.1 一元函数优化求解 483.7.2 多元函数优化求解 483.7.3 约束条件下的优化求解 503.8 习题 52第 4 章 随机数与抽样模拟 544.1 一元随机数的产生 544.1.1 均匀分布随机数 544.1.2 正态分布随机数 564.1.3 指数分布随机数 574.1.4 离散分布随机数的生成 584.1.5 常见分布函数表 594.2 多元随机数的生成 614.2.1 多元正态分布随机数 614.2.2 多元正态分布密度函数、分位数与累积概率 634.2.3 多元t分布随机数 644.3 随机抽样 654.3.1 放回与放回抽样 654.3.2 bootstrap重抽样 664.4 统计模拟 674.4.1 几种常见的模拟方法 674.4.2 模拟函数的建立方法 704.5 习题 73第 5 章 数据读写与预处理 745.1 数据的读入 745.1.1 直接输入数据 745.1.2 读R包中的数据 755.1.3 从外部文件读入数据 755.2 写出数据 795.3 数据预处理 805.3.1 变量预处理 815.3.2 变量重编码 825.3.3 变量重命名 845.3.4 变量类型的转换 855.3.5 日期变量的变换 865.4 缺失数据处理 875.4.1 缺失数据的识别 875.4.2 缺失数据的探索与检验 885.4.3 缺失数据的处理 895.5 数据集的合并与拆分 905.5.1 数据框的合并与拆分 905.5.2 数据集的合并 925.5.3 数据集的抽取 925.6 习题 93第 6 章 探索性数据分析 946.1 主要分析工具 946.1.1 探索性数据分析的工具 946.1.2 数据的类型 986.2 单变量数据分析 996.2.1 分类型数据 996.2.2 数值型数据 1016.2.3 离群值探索 1066.3 双变量数据分析 1096.3.1 分类数据对分类数据 1096.3.2 分类数据对数值型数据 1116.3.3 数值型数据对数值型数据 1126.4 多变量数据分析 1156.4.1 访问数据框数据 1156.4.2 多变量数据的分析. 1186.5 习题 124第 7 章 参数假设检验 1267.1 假设检验的思想与步骤 1267.1.1 假设检验的基本思想 1267.1.2 假设检验的基本步骤 1287.2 正态总体单样本参数假设检验 1297.2.1 均值的检验 1307.2.2 方差检验 1327.3 正态总体双样本参数假设检验 1347.3.1 双样本方差的检验(方差齐性检验). 1347.3.2 两样本均值检验 1357.4 比例假设检验 1397.4.1 单样本比例检验 1397.4.2 两样本比例检验 1417.5 习题 142第 8 章 非参数假设检验 1448.1 图示法 1448.2 卡方检验 1468.2.1 卡方分布(χ 2 distribution) 1478.2.2 卡方拟合优度检验. 1488.2.3 卡方独立性检验 1518.2.4 卡方两样本同质性检验 1518.3 秩和检验 1528.3.1 秩的概念 1538.3.2 单样本符号秩检验. 1538.3.3 两独立秩和检验 1548.3.4 多个独立样本的秩和检验 1558.3.5 多个相关样本的秩和检验 1588.4 K-S检验 1608.4.1 K-S单样本总体分布验证 1608.4.2 K-S两独立样本同质检验 1608.5 常用正态性检验 1628.5.1 偏度、峰度检验法. 1628.5.2 Shapiro-Wilk(W检验) 1638.5.3 其他常用正态检验. 1658.6 习题 167第 9 章 方差分析 1699.1 单因素方差分析 1709.2 双因素方差分析 1749.2.1 不考虑交互作用的双因素方差分析 1749.2.2 考虑交互作用的双因素分析 1789.3 习题 183第 10 章 线性回归模型 18410.1 问题提出 18410.2 一元线性回归 18510.2.1 一元线性回归概述 18610.2.2 一元线性回归的参数估计 18810.2.3 一元线性回归模型的检验 19510.2.4 一元线性回归的预测 19710.2.5 一元线性回归综合案例 20110.3 多元线性回归分析 20510.3.1 多元线性回归模型及假定 20610.3.2 参数估计 20710.3.3 模型检验 20910.3.4 预测 21110.3.5 多元线性回归综合案例 21310.4 习题 218第 11 章 线性回归模型的扩展 22011.1 多重共线性 22011.1.1 问题的提出 22011.1.2 多重共线性定义及后果 22211.1.3 多重共线性检验 22211.1.4 多重共线性克服 22511.2 异方差性 22911.2.1 问题的提出 22911.2.2 异方差性定义及后果 23111.2.3 异方差性检验 23211.2.4 异方差性克服 23611.3 序列相关性 24011.3.1 问题的提出 24111.3.2 序列相关性定义及后果 24311.3.3 序列相关性检验 24511.3.4 序列相关性克服 24811.4 习题 251第 12 章 非线性回归分析 25412.1 问题的提出 25412.2 可线性化的非线性回归 25512.2.1 Cobb-Douglas生产函数 25512.2.2 多项式方程模型 25712.2.3 指数函数模型 25912.3 不可线性化的非线性回归 26012.3.1 非线性模型的参数估计与迭代算法 26212.3.2 初始值选取 26912.3.3 收敛性 27012.4 非线性回归评价和假设检验 27112.4.1 可决系数 27112.4.2 参数显著性的F 检验 27112.4.3 似然比检验 27212.5 习题 274第 13 章 二元选择模型 27513.1 问题的提出 27613.2 线性概率(LP)模型原理 27713.3 Probit模型原理 27913.4 Logit模型原理 28013.5 边际效应分析 28113.6 最大似然估计(MLE) 28213.7 似然比检验和拟合优度 28213.8 案例分析:经济学教学新方法的效果 28413.9 扩展案例:信用卡违约预测分析 28913.9.1 描述性统计 29013.9.2 模型建立与参数估计 29113.9.3 系数意义与边际分析 29513.9.4 拟合与预测 29613.9.5 结论与建议 29713.10 习题 297第 14 章 多元选择模型 29914.1 有序选择模型 29914.1.1 问题的提出:本科生申请研究生的影响因素 30014.1.2 有序选择模型 30014.1.3 案例分析:本科生申请研究生的影响因素 30214.2 多元序Logit模型 30414.2.1 问题的提出:关于钓鱼模式的选择 30414.2.2 多元序Logit模型 30514.2.3 案例分析:关于钓鱼模式的选择 30714.3 嵌套Logit模型 30914.3.1 问题的提出:旅行交通方式选择 30914.3.2 嵌套Logit模型原理 31014.3.3 案例分析:旅行交通方式选择 31114.4 习题 313第 15 章 计数模型与受限因变量模型 31415.1 计数模型 31415.1.1 问题的提出:轮船事故的计数数据模型 31415.1.2 计数数据模型的设定 31615.1.3 计数数据模型的估计 31715.2 受限因变量模型 31915.2.1 截断模型的问题提出 31915.2.2 截断模型原理 31915.2.3 审查模型问题的提出 32115.2.4 审查模型原理 32215.2.5 最大似然估计(MLE) 32315.3 习题 328第 16 章 分位数回归 33016.1 问题的提出 33016.2 总体分位数和总体中位数 33216.3 经验分位数估计 33316.4 分位数回归原理 33416.5 扩展案例:社会保障与城乡家庭消费 33916.5.1 问题的提出 33916.5.2 数据说明 33916.5.3 实证分析 34216.5.4 结论与建议 34516.6 习题 345第 17 章 高级统计绘图 34617.1 绘制地图 34617.2 高阶绘图工具――ggplot2 35517.2.1 散点图 35517.2.2 散点图上添加平滑曲线 35817.2.3 条形图和箱线图 36017.2.4 直方图和密度曲线图 36217.2.5 时间序列图 36417.2.6 图形标注 36517.3 三维图形与等高线图 36617.3.1 三维图形 36617.3.2 等高图/等高线 36817.4 词云 36917.5 散点图矩阵与关系矩阵图 37017.6 马赛克图 37217.7 习题 374第 18 章 如何制作自己的R包 37518.1 R包基础 37618.2 在Windows中制作R包 37718.3 在RStudio中制作R包 38118.4 习题 383参考文献 384

内容摘要:

本书是一本R 语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R 语言的基本使用以及编程技巧。本书内容涵盖R 数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R 包制作等内容。本书的定位是为业界数据分析人员、经济管理类、医学的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理,这样能够帮助读者轻松上手学习。【作者简介】方匡南厦门大学经济学院统计系副教授、博士生导师、美国耶鲁大学博士后。主要研究大数据与数据挖掘、计量经济学等。主持过多项国家自然科学基金、国家社会科学基金以及企业横向课题。精通R语言并编写过多个R软件包。

书籍规格:

书籍详细信息
书名R数据分析站内查询相似图书
9787121252907
如需购买下载《R数据分析》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位电子工业出版社
版次1版印次1
定价(元)68.0语种简体中文
尺寸24 × 19装帧平装
页数印数

书籍信息归属:

R数据分析是电子工业出版社于2015.2出版的中图分类号为 TP312 的主题关于 程序语言-程序设计-教材 的书籍。