当前位置：和泉文库 > 统计 > 浏览文档

《实用统计软件》课程教学资源（阅读材料）R for beginner（中文第二版，共七章）

1 导言 2 基本原理与概念 2.1 基本原理 2.2 对象的产生，排列及删除 2.3 在线帮助 3 R的数据操作 3.1 对象 3.2 在文件中读写数据 3.3 存储数据 3.4 生成数据 3.4.1 规则序列 3.4.2 随机序列 3.5 使用对象 3.5.1 创建对象 3.5.2 对象的类型转换 3.5.3 运算符 3.5.4 访问一个对象的数值：下标系统 3.5.5 访问对象的名称 3.5.6 数据编辑器 3.5.7 数学运算和一些简单的函数 3.5.8 矩阵计算 4 R绘图 4.1 管理绘图 4.1.1 打开多个绘图设备 4.1.2 图形的分割 4.2 绘图函数 4.3 低级绘图命令 4.4 绘图参数 4.5 一个实例 4.6 grid 和lattice 包 5 R的统计分析 5.1 关于方差分析的一个简单例子 5.2 公式 5.3 泛型函数 5.4 包 6 R编程实践 6.1 循环和向量化 6.2 用R写程序 6.3 编写你自己的函数 7 R 相关的文献

文件格式：PDF，文件大小：720.02KB，售价：20.28元

共76页，可试读20页，点击往前阅读 ↑↑

文档详细内容（约76页）

向量是一个变量，其意思也即人们通常认为的那样：因子是一个分类变量：数组是一个k维的数据表：矩阵是数组的一个特例，其维数k=2。注意，数组或者矩阵中的所有元素都必须是同一种类型的：数据框是由一个或几个向量和（或）因子构成，它们必须是等长的，但可以是不同的数据类型：“s”表示时间序列数据，它包含一些额外的属性，例如频率和时间：列表可以包含任何类型的对象，包括列表！对于一个向量，用它的类型和长度足够描述数据：而对其它的对象则另需一些额外信息，这些信息由外在的属性给出。这些属性中的是表示对象维数的dim,比如一个2行2列的的矩阵，它的dim是一对数值[2,2，但是其长度是4。 3.2在文件中读写数据对于在文件读取和写入的工作，R使用工作目录来完成。可以使用命令getwd()(获得工作目录)来找到目录，使用命令setwd("c:/data")或者setwd("/home/paradis/R")来改变目录。如果一个文件不在工作目录里则必须给出它的路径8。 R可以用下面的函数读取存储在文本文件(ASCI)中的数据：read.table (其中有若干参数，见后文)，scan和read.fwf。R也可以读取以其他格式的文件(Excel,SAS,SPSS,.)和访问SQL类型的数据库，但是基础包中并不包含所需的这些函数。这些功能函数对于R的高级应用是十分有用的，但是我们在这里将读取文件限定在ASCI格式。函数read.table用来创建一个数据框，所以它是读取表格形式的数据的主要方法。举例来说，对于一个名为data.dat的文件，命令： mydata <-read.table("data.dat") 将创建一个数据框名为mydata,数据框中每个变量也都将被命名，缺省值为V1,V2,.并且可以单独地访问每个变量，代码为：mydata$V1, mydatas$v2,,或者用mydata["V1"],mydata["V2"],..,或者还有一种方法，mydata[,1],mydata[,2],.9这里有一些选项的缺省值（即如果用户不设定那么R将自动使用的值)见于下表： read.table(file,header FALSE,sep =""quote ="\"'"dec ="." row.names,col.names,as.is FALSE,na.strings "NA", colClasses NA,nrows =-1, skip =0,check.names TRUE,fill !blank.lines.skip, 8在Windows中，为Rgui.exe创建一个快捷方式是比较有用的，在快捷方式“属性”的“起始位置”中改变目录，然后用此快捷方式启动R时这个目录就会成为工作目录 9注意这几种方法的结果是有区别的：mydata$v1和mydata[,1]是向量，而mydata["v1"]是数据框。后面(p.19)将会讲到关于处理对象的详情。 11

向量是一个变量，其意思也即人们通常认为的那样；因子是一个分类变量；数组是一个k维的数据表；矩阵是数组的一个特例，其维数k = 2。注意，数组或者矩阵中的所有元素都必须是同一种类型的；数据框是由一个或几个向量和（或）因子构成，它们必须是等长的，但可以是不同的数据类型；“ts”表示时间序列数据，它包含一些额外的属性，例如频率和时间；列表可以包含任何类型的对象，包括列表！对于一个向量，用它的类型和长度足够描述数据；而对其它的对象则另需一些额外信息，这些信息由外在的属性给出。这些属性中的是表示对象维数的dim，比如一个2行2列的的矩阵，它的dim是一对数值[2,2]，但是其长度是4。 3.2 在文件中读写数据对于在文件读取和写入的工作，R使用工作目录来完成。可以使用命令getwd() (获得工作目录 )来找到目录，使用命令setwd("C:/data") 或者setwd("/home/paradis/R") 来改变目录。如果一个文件不在工作目录里则必须给出它的路径8。 R可以用下面的函数读取存储在文本文件（ASCII）中的数据：read.table (其中有若干参数，见后文)，scan和read.fwf。R也可以读取以其他格式的文件(Excel, SAS, SPSS, . . . ) 和访问SQL类型的数据库，但是基础包中并不包含所需的这些函数。这些功能函数对于R的高级应用是十分有用的，但是我们在这里将读取文件限定在ASCII格式。函数read.table用来创建一个数据框，所以它是读取表格形式的数据的主要方法。举例来说，对于一个名为data.dat的文件，命令： > mydata <- read.table("data.dat") 将创建一个数据框名为mydata，数据框中每个变量也都将被命名，缺省值为V1, V2, . . .并且可以单独地访问每个变量，代码为：mydata$V1, mydata$V2, . . . , 或者用mydata["V1"], mydata["V2"], . . . , 或者还有一种方法，mydata[, 1], mydata[,2 ], . . . 9 这里有一些选项的缺省值(即如果用户不设定那么R将自动使用的值)见于下表： read.table(file, header = FALSE, sep = "", quote = "\"’", dec = ".", row.names, col.names, as.is = FALSE, na.strings = "NA", colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill = !blank.lines.skip, 8在Windows中，为Rgui.exe创建一个快捷方式是比较有用的，在快捷方式“属性”的“起始位置”中改变目录，然后用此快捷方式启动R时这个目录就会成为工作目录 9注意这几种方法的结果是有区别的：mydata$V1和mydata[, 1]是向量，而mydata["V1"]是数据框。后面(p. 19)将会讲到关于处理对象的详情。 11

strip.white FALSE,blank.lines.skip TRUE, comment.char ="#" file 文件名（包在"“内，或使用一个字符型变量），可能需要全路径 (注意即使是在Vindows下，符号\也不允许包含在内，必须用/替换)，或者一个URL链接(http:/∥)（用URL对文件远程访问） header 一个逻辑值(FALSE or TRUE),用来反映这个文件的第一行是否包含变量名 sep 文件中的字段分离符，例如对用制表符分隔的文件使用sp="\t” quote 指定用于包围字符型数据的字符 dec 用来表示小数点的字符 row.names 保存着行名的向量，或文件中一个变量的序号或名字，缺省时行号取为1,2,3... col.names 指定列名的字符型向量（缺省值是：V1,V2,V3,·.) as.is 控制是否将字符型变量转化为因子型变量（如果值为FALSE),或者仍将其保留为字符型(TUE)。a3.is可以是逻辑型，数值型或者字符型向量，用来判断变量是否被保留为字符。 na.strings 代表缺失数据的值（转化为WA) colClasses 指定各列的数据类型的一个字符型向量 nrows 可以读取的最大行数（忽略负值） skip 在读取数据前跳过的行数 check.names 如果为IRUE,则检查变量名是否在R中有效 fill 如果为TUE且非所有的行中变量数目相同，则用空白填补 strip.white 在sep已指定的情况下，如果为TUE,则删除字符型变量前后多余的空格 blank.lines.skip 如果为IRUE,忽略空白行 comment.char ·个字符用来在数据文件中写注释，以这个字符开头的行将被忽略 (要禁用这个参数，可使用comment.char-n") read.table的几个变种因为使用了不同的缺省值可以用在几种不同情况下： read.csv(file,header TRUE,sep =""quote="\"",dec=".", fill=TRUE,...) read.csv2(file,header TRUE,sep =";"quote="\"",dec=",", fill=TRUE,...) read.delim(file,header TRUE,sep ="\t",quote="\"",dec=".", fill=TRUE,...) read.delim2(file,header TRUE,sep ="\t",quote="\"",dec=",", fill=TRUE,...) 函数scan比read.table要更加灵活，它们的区别之一是前者可以指定变量的类型，例如： 12

strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#") file 文件名（包在""内，或使用一个字符型变量），可能需要全路径（注意即使是在Windows下，符号\ 也不允许包含在内，必须用／替换），或者一个URL链接（http://...）（用URL对文件远程访问） header 一个逻辑值(FALSE or TRUE)，用来反映这个文件的第一行是否包含变量名 sep 文件中的字段分离符，例如对用制表符分隔的文件使用sep="\t" quote 指定用于包围字符型数据的字符 dec 用来表示小数点的字符 row.names 保存着行名的向量,或文件中一个变量的序号或名字,缺省时行号取为1, 2, 3, . . . col.names 指定列名的字符型向量(缺省值是：V1, V2, V3, . . . ) as.is 控制是否将字符型变量转化为因子型变量(如果值为FALSE)，或者仍将其保留为字符型（TRUE）。as.is可以是逻辑型，数值型或者字符型向量，用来判断变量是否被保留为字符。 na.strings 代表缺失数据的值(转化为NA) colClasses 指定各列的数据类型的一个字符型向量 nrows 可以读取的最大行数(忽略负值) skip 在读取数据前跳过的行数 check.names 如果为TRUE，则检查变量名是否在R中有效 fill 如果为TRUE且非所有的行中变量数目相同，则用空白填补 strip.white 在sep已指定的情况下，如果为TRUE，则删除字符型变量前后多余的空格 blank.lines.skip 如果为TRUE，忽略空白行 comment.char 一个字符用来在数据文件中写注释，以这个字符开头的行将被忽略（要禁用这个参数，可使用comment.char = ""） read.table的几个变种因为使用了不同的缺省值可以用在几种不同情况下： read.csv(file, header = TRUE, sep = ",", quote="\"", dec=".", fill = TRUE, ...) read.csv2(file, header = TRUE, sep = ";", quote="\"", dec=",", fill = TRUE, ...) read.delim(file, header = TRUE, sep = "\t", quote="\"", dec=".", fill = TRUE, ...) read.delim2(file, header = TRUE, sep = "\t", quote="\"", dec=",", fill = TRUE, ...) 函数scan比read.table要更加灵活，它们的区别之一是前者可以指定变量的类型，例如： 12

点击进入文档下载页（PDF格式）

共76页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录