久久国产午夜精品理论片34页,麻豆成人国产亚洲精品a区,樱花草在线社区www中国视频

啊啊啊啊啊吖

2018-10-28 閱讀量: 1115

R擴(kuò)展包dplyr筆記分享（1）

初始化0.1 安裝

install.packages("dplyr")

0.2 示范數(shù)據(jù)

library(Lahman): Lahman 包里的棒球比賽數(shù)據(jù)集 Batting
library(hflights): hflights 包里的飛機(jī)航班數(shù)據(jù)

0.3 數(shù)據(jù)集類型

將過(guò)長(zhǎng)過(guò)大的數(shù)據(jù)集轉(zhuǎn)換為顯示更友好的 tbl_df 類型:

hflights_df <- tbl_df(hflights)

可以 hflights_df 感受一下不再被刷屏的感覺.

1 基本操作

把常用的數(shù)據(jù)操作行為歸納為以下五種:

1.1 篩選: filter()

按給定的邏輯判斷篩選出符合要求的子數(shù)據(jù)集, 類似于 base::subset() 函數(shù)

例如:

filter(hflights_df, Month == 1, DayofMonth == 1)

用R自帶函數(shù)實(shí)現(xiàn):

hflights[hflightsMonth?==?1?&?hflightsMonth?==?1?&?hflightsDayofMonth == 1, ]

除了代碼簡(jiǎn)潔外, 還支持對(duì)同一對(duì)象的任意個(gè)條件組合, 如:

filter(hflights_df, Month == 1 | Month == 2)

注意: 表示 AND 時(shí)要使用 & 而避免 &&

1.2 排列: arrange()

按給定的列名依次對(duì)行進(jìn)行排序.

例如:

arrange(hflights_df, DayofMonth, Month, Year)

對(duì)列名加 desc() 進(jìn)行倒序:

arrange(hflights_df, desc(ArrDelay))

這個(gè)函數(shù)和 plyr::arrange() 是一樣的, 類似于 order()

用R自帶函數(shù)實(shí)現(xiàn):

hflights[order(hflightsDayofMonth,hflightsMonth, hflightsYear),]hflights[order(desc(hflightsArrDelay)), ]

1.3 選擇: select()

用列名作參數(shù)來(lái)選擇子數(shù)據(jù)集:

select(hflights_df, Year, Month, DayOfWeek)

還可以用 : 來(lái)連接列名, 沒(méi)錯(cuò), 就是把列名當(dāng)作數(shù)字一樣使用:

select(hflights_df, Year:DayOfWeek)

用 - 來(lái)排除列名:

select(hflights_df, -(Year:DayOfWeek))

同樣類似于R自帶的 subset() 函數(shù) (但不用再寫一長(zhǎng)串的 c("colname1", "colname2") 或者 which(colname(data) == "colname3"), 甚至還要去查找列號(hào))

1.4 變形: mutate()

對(duì)已有列進(jìn)行數(shù)據(jù)運(yùn)算并添加為新列:

mutate(hflights_df,? ?gain = ArrDelay - DepDelay,? ?speed = Distance / AirTime * 60)

作用與 plyr::mutate() 相同, 與 base::transform() 相似, 優(yōu)勢(shì)在于可以在同一語(yǔ)句中對(duì)剛增加的列進(jìn)行操作:

mutate(hflights_df,? ?gain = ArrDelay - DepDelay,? ?gain_per_hour = gain / (AirTime / 60))

而同樣操作用R自帶函數(shù) transform() 的話就會(huì)報(bào)錯(cuò):

transform(hflights,? ?gain = ArrDelay - DepDelay,? ?gain_per_hour = gain / (AirTime / 60))1.5 匯總: summarise()

對(duì)數(shù)據(jù)框調(diào)用其它函數(shù)進(jìn)行匯總操作, 返回一維的結(jié)果:

summarise(hflights_df,? ?delay = mean(DepDelay, na.rm = TRUE))

等同于 plyr::summarise(), 原文說(shuō)該函數(shù)功能尚不是非常有用, 大概以后的更新會(huì)加強(qiáng)吧。

0.0000

關(guān)注作者

評(píng)論(0)

發(fā)表評(píng)論

暫無(wú)數(shù)據(jù)

CDA考試動(dòng)態(tài)

CDA報(bào)考指南

推薦帖子

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www