概述
一 帮助文档的使用
1 通过help函数可以查看函数的全部内容,比如help(functionName)
2 用args函数可以快速获取函数的参数,比如args(functionName)
3用example函数可以查看函数的使用实例,比如example(functionName)
mean函数
mean函数就是求向量中算术平均值的函数,但是里面的trim参数要注意。例如mean(x,trim=0.1)就是在x首尾两段去除0.1x个数,再对x求平均值。
下面是trim参数的官方文档
trim
the fraction (0 to 0.5) of observations to be trimmed from each end of x before the mean is computed. Values of trim outside that range are taken as the nearest endpoint.
mean函数还有一个参数是na.rm,表示为是否去除向量中的NA值(Not Available)
mean函数默认为mean(x,trim=0,na.rm=FALSE)
输出
print(),print函数可以任意输出数据,但是它有局限性,就是每次只能输出一个对象。
cat(),cat函数可以将多个对象连接并一起输出.
但它也有缺陷,就是cat无法输出复杂的数据结构,比如矩阵.
显示变量
ls()函数可以显示当前所有的对象
ls.str()将更详细的显示,不仅显示对象名,还显示对象的值
删除变量
rm()函数(remove)可以删除变量,rm(x),rm(x,y,z)
rm()函数结合ls()函数可以删除当前空间中所有的变量rm(list=ls())
注意分享代码时不要分享这种恶意代码!
生成向量
生成向量可以用v = c(x1,x2,...xn)
的格式来生成,其中构成向量的元素可以是数值,字符串,也可以是逻辑值。但是不能多个格式混用。
如果构成向量的元素也是向量,那么c(...)
会将它们拼接起来。
查看对象类型 mode(x)
计算基本统计量
计算均值,中位数,标准差,方差,协方差,相关系数的函数依次为
mean(x)
median(x)
sd(x)
var(x)
cov(x,y)
cor(x,y)
其中要注意,cov()和cor()对数据中是否含有缺失值(NA)十分敏感,甚至可能报错。要自己判断缺失值是否会对结果产生重要影响,如果影响不大,可以设置参数na.rm=TRUE
来忽略缺失值
生成数列
简单生成分割为1的数列,可以直接1:6
,就能生成1,2,3,4,5,6的数列
如果分割不为1,可以使用seq函数,例如seq(from=1.to=9,by=4)
就会生成从1到9,间隔为4的数列。
使用rep函数,可以生成由一个数重复组成的数列rep(1,times=5)
向量的比较
如果使用逻辑运算符来进行向量之间的比较,则结果会对每一个元素都返回一个逻辑值
v1 = c(1,2,3)
v2 = c(3,2,1)
v1 >= v2
结果为FALSE,TRUE,TRUE
还可以使用any和all函数进行向量的比较
any(v1>=v2) 返回TRUE
all(v1>=v2) 返回FALSE
选取向量中的元素
注意,在R语言中,向量中元素的下标初始值为1,而不是0
比如v = c(1,2,3) v[2]
就代表选取了向量中第2个元素
如果在索引前加负号,会排除该元素v1[-2]输出为1,3
但是,这并不意味着原来的向量发生了改变,v1仍然是1,2,3
此外,还可以通过向量索引来选择多个值
比如v1[1:3]
会选择下标为1到3的元素
或者是v[c(1,2,4,6)]
则会选择下标为1,2,4,6的元素
逻辑向量也可用于索引v[v<10]
会选择向量中小于10的值
结合这些选择方法,可以实现强大的功能,比如
v[v>median(v)] 选择大于中位数的值
v[(v<quantile(v,0.05)|(v>quantile(v,0.95)))] 选择分布于两端百分之五的元素
v[abs(v-mean(v)>2*sd(x))]
选择处于均值的两倍标准差区间以外的元素
v[!is.na(x)&!is.null(x)] 选择所有不是NA值或null值的元素
最后
以上就是潇洒水壶为你收集整理的美赛R语言学习第一周(一)的全部内容,希望文章能够帮你解决美赛R语言学习第一周(一)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复