R语言数据操作
R语言数据操作封面图

R语言数据操作

(美) 斯佩克特 (Spector,P.) , 著

出版社:西安交通大学出版社

年代:2011

定价:28.0

书籍简介:

本书提供了使用R语言读取数据并进行高效操作的诸多方法。除了R内置函数之外,还介绍了可以从R网站CRAN免费下载的许多有用的软件包的使用(R本身就是一个免费软件)。所介绍的方法都能充分利用R软件的核心优势:向量化运算和添注的使用。使得数据处理变得易如反掌,为读者的数据处理开辟了一片新天地。

作者介绍:

菲尔·斯佩克特 1983年在美国德州农工大学获得统计学博士学位,1987年至今在美国加州大学伯克利分校从事教研工作。现任该校统计系的应用程序管理员,为统计系副教授,主讲统计计算课程。迄今已发表多篇关于统计计算和统计软件的论文,并著有三本书,其中data Manipulation with R已翻译成日文出版。

书籍目录:

译者序

前言

第1章 R中的数据

1.1 模式和类

1.2 R的数据存储

1.3 模式与类的检测

1.4 R对象的结构

1.5 对象的转换

1.6 缺失值

1.7 缺失值的处理

第2章 读取和写入数据

2.1 读取向量和矩阵

2.2 数据框:read.table

2.3 逗号和制表符分隔的输入文件

2.4 固定宽度输入文件

2.5 从R对象中提取数据

2.6 连接

2.7 读取大型数据文件

2.8 生成数据

2.8.1 序列

2.8.2 随机数

2.9 排列

2.9.1 随机排列

2.9.2 枚举所有排列

2.10 序列的处理

2.11 电子表格

2.11.1 基于Windows的RODBC包

2.11.2 gdata程序包(所有平台)

2.12 保存和加载R数据对象

2.13 处理二进制文件

2.14 将R对象写入ASCII格式的文件

2.14.1 write函数

2.14.2 write.table函数

2.15 从其它程序中读取数据

第3章 R与数据库

3.1 SQL简介

3.1.1 导航命令

3.1.2 SQL基础

3.1.3 综合汇总

3.1.4 两个数据库的合并

3.1.5 子查询

3.1.6 修改数据库记录

3.2 ODBC

3.3 使用RODBC包

3.4 DBI包

3.5 访问MySQL数据库

3.6 执行查询

3.7 规范化的表

3.8 将数据读入MySQL

3.9 更复杂的汇总

第4章 日期

4.1 as.Date

4.2 chron包

4.3 POSIX类

4.4 日期的处理

4.5 时间间隔

4.6 时间序列

第5章 因子

5.1 因子的使用

5.2 数值型因子

5.3 因子的操作

5.4 根据连续变量创建因子

5.5 基于日期和时间的因子

5.6 交互作用

第6章 下标

6.1 下标的基础知识

6.2 数值型下标

6.3 字符型下标

6.4 逻辑型下标

6.5 矩阵和数组的下标

6.6 矩阵的特殊函数

6.7 列表

6.8 数据框下标

第7章 字符操作

7.1 字符数据的基础知识

7.2 显示和连接字符串

7.3 处理分散的字符值

7.4 R中的正则表达式

7.5 正则表达式的基础知识

7.6 拆分字符值

7.7 在R中使用正则表达式

7.8 替换和标记

第8章 数据汇总

8.1 table函数

8.2 汇总路线图

8.3 将函数映射到向量或列表

8.4 将函数映射到矩阵或数组

8.5 基于组的函数映射

8.6 reshape包

8.7 R中的循环

第9章 重塑数据

9.1 修改数据框中的变量

9.2 变量的重新编码

9.3 recode函数

9.4 重塑数据框

9.5 reshape包

9.6 合并数据框

9.7 在merge的环境下

索引

内容摘要:

自创立以来,R已经成为统计计算和数据分析的一个优秀软件。该软件的唾手可得以及范围广泛的程序包再加上随时提供支持的R社区,使R成为几乎任何一种和统计相关的计算任务的一个极好选择。然而,很多用户,特别是那些有其它程序语言经验的用户,并没有完全利用R的能力。由于R的特性,在其它程序语言中有用的方法在R中可能效率并不高。菲尔·斯佩克特的《R语言数据操作》展示了一系列将数据读入R并进行高效处理的方法。
除了内置的函数,还包括了可以从CRAN(综合R档案网络)下载的大量现成的程序包。展示的所有方法都利用了R的核心特性:对于通常的数据管理任务所提供的向量化运算,高效的下标使用,R函数的正确使用。
最有经验的R用户发现,特别是在处理大型数据集时。将R和其它程序结合使用可能会有帮助,尤其是数据库程序。因此,对于在R中使用数据库,以及从电子表格和其它程序创建的数据集中提取数据的方法,这些都有详细的论述。R中虽然有时会忽略字符操作,在这里却作了详细的论述。使得那些传统地使用脚本语言解决的问题完全可以用R解决。对于那些有其它程序语言经验的用户提供了有效使用程序结构——例如循环——的指南。
由于许多统计建模和图形函数需要数据框形式的数据,全书自始至终都提供了将普通函数的输出结果转化为数据框的技术。
通过使用各种不同的例子(其数据来源于R或者是轻松可得的模拟数据集),《R语言数据操作》可推荐给任何想从运行简单的例子提高到可以对实际的真实数据提供操作解决方案的R使用者。

书籍规格:

书籍详细信息
书名R语言数据操作站内查询相似图书
9787560538730
如需购买下载《R语言数据操作》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地西安出版单位西安交通大学出版社
版次1版印次1
定价(元)28.0语种简体中文
尺寸23 × 17装帧平装
页数印数

书籍信息归属:

R语言数据操作是西安交通大学出版社于2011.6出版的中图分类号为 TP312 的主题关于 程序语言-程序设计 的书籍。