R语言核心技术手册

R语言核心技术手册

(美) 阿德勒 (Adler,J.) , 著

出版社:电子工业出版社

年代:2014

定价:99.0

书籍简介:

本书是开源的统计应用语言R的简明技术手册。书中介绍了从安装R软件到基本语法以及应用的全过程,可以帮助你学习和使用R。全书共6部分,26章,基本涵盖了R的所有功能,而且提供了大量的实例说明运用R语言解决问题的过程。作为第2版,本书增加了一些处理数据的新章节,将绘图章节集中放在“可视化篇”,同时针对R的版本变化做了一些升级。

作者介绍:

刘思喆,中国人民大学统计学院科班出身,国内资深R领域专家,拥有10年R语言使用经验,中国R语言会议联合发起人。《153分钟学会R》作者,《Rreferencecard》译者。“统计之都”理事会成员,R语言版版主;电信、互联网、彩票行业资深数据挖掘专家。CSDN大数据技术论坛、DATAWorldForum、中国人民大学数据挖掘中心特邀讲师。

书籍目录:

前言 xvi

I 基础篇

第1 章获取和安装R

R 版本

R 的安装

Windows

Mac OS X

Linux 和UNIX 系统

第2 章R 的用户界面

R 的图形用户界面

Windows

Mac OS X

Linux 和UNIX 程序

R 控制台

命令行编辑

批处理模式

在Excel 中使用R

RStudio

其他运行R 的方式

第3 章简短的示例

基本操作

函数

变量

数据结构简介

对象和类

模型和公式

图表

获得帮助

第4 章R 包

R 包概览

列示本地库中的R 包

加载R 包

在Windows 和Linux 系统下加载R 包

在Mac OS X 系统下加载R 包

搜索R 包资源库

探索网络上的R 包资源库

基于R 界面搜寻和安装包

从其他资源库安装R 包

定制R 包

创建包目录

创建R 包

II 语言篇

第5 章R 语言概览

表达式

对象

符号

函数

在赋值语句中,对象会被复制

R 中一切皆为对象

特殊值

NA

Inf 和-Inf

NaN

NULL

强制转换

R 解释器

观察R 是如何工作的

第6 章R 语法

常量

数值向量

字符向量

符号

运算符

运算顺序

赋值操作

表达式

分离型表达式

括号

花括号

控制结构

条件语句

循环

访问数据结构

数据结构操作符

通过整数向量引用

通过逻辑向量引用

通过名字进行引用

R 编程标准

第7 章R 对象

基本对象类型

向量

列表

其他对象

矩阵

数组

因子

数据框

公式

时间序列

Shingle 对象

日期和时间对象

连接对象

属性

第8 章符号和环境

符号

环境

全局环境

环境和函数

调用堆栈

在不同的环境中对函数求值

向环境中添加对象

异常

提示错误

捕获错误

第9 章函数

函数的关键字

参数

返回值

函数参数

匿名函数

函数的属性

参数顺序和具名实参

副作用

改变其他环境

输入/输出

图形

第10 章面向对象编程

R 的面向对象编程概览

核心概念

实现的例子

R 的面向对象编程:S4

类的定义

对象的新建

槽的存取

对象的操作

创建强制转换方法

方法

方法的管理

基本类型

更多的帮助

守旧派的OOP:S3

S3 的类

S3 方法

在S4 的类中使用S3 的类

查找隐藏的S3 方法

III 数据篇

第11 章数据的存取和编辑

在R 中输入数据

用R 命令输入数据

用图形界面输入数据

保存和读入R 对象

用save 保存对象

从外部文件导入数据

文本文件

其他软件

导出数据

从数据库获取数据

导出然后导入

数据库连接包

RODBC

DBI

TSDBI

从Hadoop 中获取数据

第12 章准备数据

合并数据集

粘贴数据结构

通过共同字段合并数据

数据转换

变量重新赋值

转换函数

对对象的每个元素进行函数运算

数据分段

shingle

Cut

利用分组变量合并对象

子集

中括号索引的方式

subset 函数

随机抽样

汇总函数

tapply 与aggregate

用rowsum 聚合表格

计数

数据修整

数据清洗

查找和删除重复数据

排序

IV 可视化篇

第13 章图形

R Graphics 概述

散点图

时间序列

柱状图

饼图

分类数据绘图

三维数据

绘制分布图

箱线图

画图设备

自定义图形

绘图函数常见参数

图形参数

基本图形函数

第14 章Lattice 绘图

历史

lattice 包概述

lattice 的工作原理

例子

使用lattice 函数

定制面板函数

高级lattice 函数

单一的网格作图

二元网格作图

三元图

其他图形

定制lattice 图

lattice 函数的常用参数

trellisskeleton

指定如何绘制坐标轴

参数

plottrellis

stripdefault

simpleKey

低级函数

低级绘图函数

面板函数

第15 章ggplot2

一个简短的介绍

图形语法

一个更复杂的例子:医保数据

快速绘图

用ggplot2 绘图

更多信息

V 统计篇

第16 章数据分析

描述性统计

相关系数和协方差

主成分分析

因子分析

bootstrap 重抽样

第17 章概率分布

正态分布

常见分布的参数

分布函数族

第18 章统计检验

连续型数据

基于正态分布的检验

不依赖分布的检验

离散数据

比例检验

二项式检验

列联表检验

列联表非参数检验

第19 章功效检验

实验设计示例

t 检验实验设计

比例实验设计

方差分析设计

第20 章回归模型

简单的线性模型示例

拟合模型

指定模型的工具函数

获取模型信息

更新模型

lm 函数的详述

最小二乘回归的假设

稳健回归和阻力回归

子集选取和Shrinkage 回归

变量的逐步选取

岭回归

Lasso 和最小角回归

弹性网络

主成分回归和偏最小二乘回归

非线性模型

广义线性模型

glmnet 包

非线性最小二乘

生存模型

平滑

样条线

拟合多项式曲面

核平滑

回归的机器学习算法

回归树模型

MARS 算法

神经网络

投影寻踪回归

广义可加模型

支持向量机

第21 章分类模型

线性分类模型

logistic 回归

线性判别分析

对数线性模型

机器学习分类模型

k 近邻

分类树模型

神经网络

支持向量机

随机森林

第22 章机器学习

购物篮分析

聚类

距离度量

聚类算法

第23 章时间序列分析

自相关函数

时间序列模型

VI 其他主题

第24 章优化R 程序性能

R 程序性能的测量

时间测定

性能分析

监控内存的使用

内存性能分析

优化你的R 代码

使用向量操作

R 中查找的性能

使用数据库查询大数据集

内存预分配

清理内存

大数据集的函数

加速R 的其他方法

R 字节码编译器

高性能的R 版本

第25 章Bioconductor

例子

加载原始的表达数据

从GEO 读取数据

匹配表型数据

分析表达数据

关键的Bioconductor 包

数据结构

eSet

AssayData

AnnotatedDataFrame

MIAME

Bioconductor 包使用的其他类

如何进一步学习

Bioconductor 之外的资源

教程

课程

相关图书

第26 章R 和Hadoop

R 和Hadoop

Hadoop 简介

RHadoop

Hadoop streaming

了解更多

一些其他的用R 做并行计算的包

Segue

doMC

从哪里我们可以了解更多6

参考文献

索引

内容摘要:

R 是一款优秀的开源统计应用语言,它直观、易用、低成本,而且还有庞大的社区支持,随着数据挖掘技术的兴起,R 语言得到了广泛的应用。本书介绍从安装R 软件到基本语法以及应用的全过程,可以帮助你全面地学习和使用R。《R语言核心技术手册(第2版)》共6部分,26 章,基本涵盖了R 语言的所有功能,而且提供了大量的实例说明运用R 语言绘图、分析数据以及拟合统计模型的过程。书中虽然涉及很多统计学理论和知识,但并不是本书的重点。
  《R语言核心技术手册(第2版)》增加了一些处理数据的新章节,将绘图章节集中放在“可视化篇”,同时针对R 的版本变化做了一些升级。

编辑推荐:

如果你打算用R进行统计计算和数据可视化,本书就是关于使用开源R语言(软件环境)快速解决上述问题的实用指导教程。通过本书,你将学会如何编写R函数以及借助R包进行数据预处理、可视化以及数据分析。作者用取自制医学、商业和体育领域的丰富案例对上述问题进行了讲解。
   √ 多达数百个实例的R教程,快速入门R语言
   √ 探索R语言的语法、对象和其他语言细节
   √ 在网站上可找到包括Bioconductor在内的数千个用户共享的R包
   √ 学习如何用R完成数据分析预处理
   √ 基于R graphics、lattice和ggplot2包 进行数据可视化
   √ 使用R语言计算概率分布、统计检验以及拟合模型
   √ 基于Hadoop并行编程提升大规模运算的效率
   √ 学习R语言的完整参考手册
   第二版的内容依据R 2.14和R 2.15进 行了更新,并新增了R高性能计算、基于ggplot2的数据可视化和利用Hadoop做并行运算等章节。
  
海报:

书籍规格:

书籍详细信息
书名R语言核心技术手册站内查询相似图书
9787121237867
如需购买下载《R语言核心技术手册》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地北京出版单位电子工业出版社
版次1版印次1
定价(元)99.0语种简体中文
尺寸23 × 16装帧平装
页数印数

书籍信息归属:

R语言核心技术手册是电子工业出版社于2014.7出版的中图分类号为 TP312 ,O212.1 的主题关于 程序语言-程序设计 ,统计数据-统计分析 的书籍。