R语言笔记 分组计算描述性统计量aggregate, summaryBy ,describe.by
admin
2023-02-16 05:20:08
0

 

在比较多组个体或观测时,关注的焦点经常是各组的描述性统计信息,而不是样本整体的描

述性统计信息。同样地,在R中完成这个任务有若干种方法。我们将以获取变速箱类型各水平的

描述性统计量开始。

vars<- c("mpg","hp","wt")

> aggregate(mtcars[vars],by=list(am=mtcars$am),median)

  am  mpg  hp   wt

1  0 17.3 175 3.52

2  1 22.8 109 2.32

注意list(am=mtcars$am)的使用。如果使用的是list(mtcars$am),则am列将被标注为

Group.1而不是am。你使用这个赋值指定了一个更有帮助的列标签。如果有多个分组变量,可以

使用by=list(name1=groupvar1, name2=groupvar2, ... , groupvarN)这样的语句。



> aggregate(mtcars[vars],by=list(am=mtcars$am,gear=mtcars$gear),median)

  am gear   mpg    hp    wt

1  0    3 15.50 180.0 3.730

2  0    4 21.00 109.0 3.315

3  1    4 25.05  79.5 2.260

4  1    5 19.70 175.0 2.770

------------------------------------------------

doBy包和psych包也提供了分组计算描述性统计量的函数。同样地,它们未随基本安装发布,

必须在首次使用前进行安装。doBy包中summaryBy()函数的使用格式为



> summaryBy(mpg+hp+wt~am,data=mtcars,FUN=mtstat)

  am mpg.n mpg.mean mpg.stdev mpg.skew mpg.kurtosis hp.n  hp.mean hp.stdev   hp.skew hp.kurtosis wt.n wt.mean  wt.stdev   wt.skew wt.kurtosis

1  0    32 20.09062  6.026948 0.610655    -0.372766   32 146.6875 68.56287 0.7260237  -0.1355511   32 3.21725 0.9784574 0.4231465 -0.02271075

>

> describe.by(mtcars[vars],mtcars$am)

group: 0

    vars  n   mean    sd median trimmed   mad   min    max  range skew kurtosis    se

mpg    1 32  20.09  6.03  19.20   19.70  5.41 10.40  33.90  23.50 0.61    -0.37  1.07

hp     2 32 146.69 68.56 123.00  141.19 77.10 52.00 335.00 283.00 0.73    -0.14 12.12

wt     3 32   3.22  0.98   3.33    3.15  0.77  1.51   5.42   3.91 0.42    -0.02  0.17


------------------------------------------------------------------------------

的reshape包灵活地按组导出描述性统计量

dfs <- melt(mtcars,measure.vars=c("mpg","hp","wt"),id.vars=c("am","cyl"))

> cast(dfs,am+cyl+variable~.,dstats)

  am cyl variable  n       mean         sd

1  0   4      mpg 11  26.663636  4.5098277

2  0   4       hp 11  82.636364 20.9345300

3  0   4       wt 11   2.285727  0.5695637

4  0   6      mpg  7  19.742857  1.4535670

5  0   6       hp  7 122.285714 24.2604911

6  0   6       wt  7   3.117143  0.3563455

7  0   8      mpg 14  15.100000  2.5600481

8  0   8       hp 14 209.214286 50.9768855

9  0   8       wt 14   3.×××14  0.7594047


相关内容

热门资讯

馆校合作丨南充科技馆走进仪陇县... 馆校合作 南充科技馆走进 NCSTM 仪陇县实验学校 天府科普研学游 4月29日上午,南充科技馆科普...
我国本土发现的首块月球陨石有重... 我国本土发现的首块月球陨石揭示了月球两次关键地质事件,并发现一种月球新矿物。 2026年世界地球日,...
马斯克的GPU也在摸鱼?狂囤几... 新智元报道 编辑:元宇 【新智元导读】马斯克囤了几十万张卡,结果只跑了11%?据媒体报道,xAI的...
原创 特... 4月24日,白宫以总统人事办公室的名义,向美国国家科学委员会的22名在任委员群发了一封冷冰冰的电子邮...
以军总参谋长:若伊朗袭击以色列... △以色列国防军总参谋长扎米尔(资料图)当地时间5月5日,以色列国防军总参谋长扎米尔表示,如果伊朗在海...
神龙拜耳光伏有限公司生产支架 光伏支架,到底“支”起了什么? 提到光伏电站,很多人第一反应是那一块块深蓝色的电池板。但真正让这些电...
食品级制冰袋厂家选型指南:上海... 导语:在餐饮、物流、医药等行业中,制冰袋作为低温保鲜的核心耗材,其性能稳定性直接影响产品品质与运营效...
南通崇川发放首笔“算力券”补贴 购买、领券、付款……近日,随着在南通市公共算力服务平台算力超市完成中国移动算力服务的租用下单操作,江...
百万上下文之后,拼什么? 文 | 科技不许冷 过去几天,科技圈的视线全被DeepSeek吸走了。 满屏都是传闻中的估值溢价,...
成语之都 好玩邯郸丨邯山区AI... (来源:邯郸新闻网) 转自:邯郸新闻网 近日,在邯山区科技创新产业园内的邯郸人工智能教育基地,一拨拨...