2018-11-03
閱讀量:
897
按多個(gè)變量分組
當(dāng)使用多個(gè)變量進(jìn)行分組時(shí),每次的摘要統(tǒng)計(jì)會(huì)用掉一個(gè)分組變量。這樣就可以輕松地對(duì)
數(shù)據(jù)集進(jìn)行循序漸進(jìn)的分析:
daily <- group_by(flights, year, month, day)
(per_day <- summarize(daily, flights = n()))
#> Source: local data frame [365 x 4]
#> Groups: year, month [?]
#>
#> year month day flights
#> <int> <int> <int> <int>
#> 1 2013 1 1 842
#> 2 2013 1 2 943
#> 3 2013 1 3 914
#> 4 2013 1 4 915
#> 5 2013 1 5 720
#> 6 2013 1 6 832
#> # ... with 359 more rows
(per_month <- summarize(per_day, flights = sum(flights)))
#> Source: local data frame [12 x 3]
#> Groups: year [?]
#>
#> year month flights
#> <int> <int> <int>
#> 1 2013 1 27004
#> 2 2013 2 24951
#> 3 2013 3 28834
#> 4 2013 4 28330
#> 5 2013 5 28796
#> 6 2013 6 28243
#> # ... with 6 more rows
(per_year <- summarize(per_month, flights = sum(flights)))
#> # A tibble: 1 × 2
#> year flights
#> <int> <int>
#> 1 2013 336776
在循序漸進(jìn)地進(jìn)行摘要分析時(shí),需要小心:使用求和與計(jì)數(shù)操作是沒問題的,但如果想要
使用加權(quán)平均和方差的話,就要仔細(xì)考慮一下,在基于秩的統(tǒng)計(jì)數(shù)據(jù)(如中位數(shù))上是無
法進(jìn)行這些操作的。換句話說,對(duì)分組求和的結(jié)果再求和就是對(duì)整體求和,但分組中位數(shù)
的中位數(shù)可不是整體的中位數(shù)。






評(píng)論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論