dplyr 数据操作统计描述（summarise）

268 阅读 0 评论 177 点赞

我是靠谱客的博主舒适鸵鸟，这篇文章主要介绍dplyr 数据操作统计描述（summarise），现在分享给大家，希望可以做个参考。

在R中，summary()是一个基础包中的重要统计描述函数，同样的在dplyr中summarise()函数也可以对数据进行统计描述。

不同的是summarise()更加的灵活多变，下面来看下summarise这个函数

summarise(.data, ...)

其灵活性和其他dplyr函数一样，主要在于条件的使用上

下面看些具体的例子

library(dplyr)
x<-data.frame(id=1:6,
              name=c("wang","zhang","li","chen","zhao","song"),
              shuxue=c(89,85,68,79,96,53),
              yuwen=c(77,68,86,87,92,63))
x

summarise(x,sum(shuxue))

可以很好的配合聚合函数一起使用

summarise(group_by(x,name),sum(shuxue))

这里由于每个name对应的shuxue只有一个参数，所以sum的结果没变化。

summarise(group_by(x,name),sum(shuxue,yuwen))

可以看出shuxue和yuwen求和后的数据。

arrange(summarise(group_by(x,name),qiuhe=sum(shuxue,yuwen)),desc(qiuhe))

配合上前面的函数，就可以对求和后的数据进行排序，当然上面数据的可读性较低。

把他分为两个步骤，理解起来可能会相对比较容易。

y<-summarise(group_by(x,name),qiuhe=sum(shuxue,yuwen)) 求和过程

arrange(y,desc(qiuhe))　排序过程

summarise(x,mean(shuxue),sd(shuxue))

求均值和方差

summarise(group_by(x,name),a=n(),b=a+2)

配合你n()可以对每个因子的出现次数进行统计。

summarise_all(group_by(x,name),mean)

对所有列按照name分组后求平均值

summarise_if(x,is.numeric,mean)

对所有是数值的列求平均值

summarise_at(x,c(3,4),mean)

对特定的列求平均值

类似结果的表达方式有：

summarise_at(x,vars(shuxue,yuwen),mean)
summarise_at(x,c("shuxue","yuwen"),mean)

summarise_all(select(x,c(1,3,4)),funs(min,max,mean,sum,sd))

使用funs，对数据进行多重聚合统计。

summarise_each(x[c(1,3,4)],funs(mean,sum))

summarise_each也可以达到类似的效果。

转载于:https://www.cnblogs.com/wkslearner/p/5744132.html

最后

以上就是舒适鸵鸟最近收集整理的关于dplyr 数据操作统计描述（summarise）的全部内容，更多相关dplyr内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：Other
浏览次数：268 次浏览
发布日期：2024-05-04 16:05:02

R语言dplyr包summarise_at函数计算dataframe数据中多个数据列（通过向量指定）的方差R语言dplyr包summarise_at函数计算dataframe数据中多个数据列（通过向量指定）的方差

R语言dplyr包summarise_at函数计算dataframe数据中多个数据列（通过向量指定）的计数个数、均值和中位数、在每个函数内部指定na.rm参数、通过list指定函数列表R语言dplyr包summarise_at函数计算dataframe数据中多个数据列（通过向量指定）的计数个数、均值和中位数、在每个函数内部指定na.rm参数、通过list指定函数列表

R语言dplyr包summarise_at函数计算dataframe数据中多个数据列（通过向量指定）的方差（使用.符号和~符号指定函数语法purr）R语言dplyr包summarise_at函数计算dataframe数据中多个数据列（通过向量指定）的方差（使用.符号和~符号指定函数语法purr）

R语言dplyr包group_by函数和summarise_at函数计算dataframe计算不同分组的计数个数和均值（Summarise Data by Categorical Variable）R语言dplyr包group_by函数和summarise_at函数计算dataframe计算不同分组的计数个数和均值（Summarise Data by Categorical Variable）

dplyr 数据操作统计描述（summarise）

最后

评论列表共有 0 条评论

发表评论取消回复

dplyr 数据操作 统计描述（summarise）

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

dplyr 数据操作统计描述（summarise）

发表评论取消回复