99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

R語言數(shù)據(jù)處理包dplyr、tidyr筆記

2017-01-25

R語言數(shù)據(jù)處理包dplyr、tidyr筆記

dplyr包是Hadley Wickham的新作，主要用于數(shù)據(jù)清洗和整理，該包專注dataframe數(shù)據(jù)格式，從而大幅提高了數(shù)據(jù)處理速度，并且提供了與其它數(shù)據(jù)庫的接口；tidyr包的作者是Hadley Wickham，該包用于“tidy”你的數(shù)據(jù)，這個包常跟dplyr結合使用。

本文將介紹dplyr包的下述五個函數(shù)用法：

篩選: filter()
排列: arrange()
選擇: select()
變形: mutate()
匯總: summarise()
分組: group_by()
以及tidyr包的下述四個函數(shù)用法：

gather—寬數(shù)據(jù)轉為長數(shù)據(jù)；
spread—長數(shù)據(jù)轉為寬數(shù)據(jù)；
unit—多列合并為一列；
separate—將一列分離為多列；
　dplyr、tidyr包安裝及載入

install.packages("dplyr")
install.packages("tidyr")

library(dplyr)
library(tidyr)
使用datasets包中的mtcars數(shù)據(jù)集做演示，首先將過長的數(shù)據(jù)整理成友好的tbl_df數(shù)據(jù)：

mtcars_df = tbl_df(mtcars)
dplyr包基本操作

　1.1 篩選: filter()

按給定的邏輯判斷篩選出符合要求的子數(shù)據(jù)集

filter(mtcars_df,mpg==21,hp==110)

# A tibble: 2 x 11
    mpg   cyl disp    hp drat    wt qsec    vs    am gear carb
<dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1    21     6   160   110   3.9 2.620 16.46     0     1     4     4
2    21     6   160   110   3.9 2.875 17.02     0     1     4     4
　1.2 排列: arrange()

按給定的列名依次對行進行排序：

arrange(mtcars_df, disp) #可對列名加 desc(disp) 進行倒序

# A tibble: 32 x 11
     mpg   cyl disp    hp drat    wt qsec    vs    am gear carb
   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   33.9     4 71.1    65 4.22 1.835 19.90     1     1     4     1
2   30.4     4 75.7    52 4.93 1.615 18.52     1     1     4     2
3   32.4     4 78.7    66 4.08 2.200 19.47     1     1     4     1
4   27.3     4 79.0    66 4.08 1.935 18.90     1     1     4     1
5   30.4     4 95.1   113 3.77 1.513 16.90     1     1     5     2
6   22.8     4 108.0    93 3.85 2.320 18.61     1     1     4     1
7   21.5     4 120.1    97 3.70 2.465 20.01     1     0     3     1
8   26.0     4 120.3    91 4.43 2.140 16.70     0     1     5     2
9   21.4     4 121.0   109 4.11 2.780 18.60     1     1     4     2
10 22.8     4 140.8    95 3.92 3.150 22.90     1     0     4     2
# ... with 22 more rows
　1.3 選擇: select()

用列名作參數(shù)來選擇子數(shù)據(jù)集:

select(mtcars_df, disp:wt)

# A tibble: 32 x 4
    disp    hp drat    wt
* <dbl> <dbl> <dbl> <dbl>
1 160.0   110 3.90 2.620
2 160.0   110 3.90 2.875
3 108.0    93 3.85 2.320
4 258.0   110 3.08 3.215
5 360.0   175 3.15 3.440
6 225.0   105 2.76 3.460
7 360.0   245 3.21 3.570
8 146.7    62 3.69 3.190
9 140.8    95 3.92 3.150
10 167.6   123 3.92 3.440
# ... with 22 more rows
　1.4 變形: mutate()

對已有列進行數(shù)據(jù)運算并添加為新列:

mutate(mtcars_df,
NO = 1:dim(mtcars_df)[1])

# A tibble: 32 x 12
     mpg   cyl disp    hp drat    wt qsec    vs    am gear carb    NO
   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <int>
1   21.0     6 160.0   110 3.90 2.620 16.46     0     1     4     4     1
2   21.0     6 160.0   110 3.90 2.875 17.02     0     1     4     4     2
3   22.8     4 108.0    93 3.85 2.320 18.61     1     1     4     1     3
4   21.4     6 258.0   110 3.08 3.215 19.44     1     0     3     1     4
5   18.7     8 360.0   175 3.15 3.440 17.02     0     0     3     2     5
6   18.1     6 225.0   105 2.76 3.460 20.22     1     0     3     1     6
7   14.3     8 360.0   245 3.21 3.570 15.84     0     0     3     4     7
8   24.4     4 146.7    62 3.69 3.190 20.00     1     0     4     2     8
9   22.8     4 140.8    95 3.92 3.150 22.90     1     0     4     2     9
10 19.2     6 167.6   123 3.92 3.440 18.30     1     0     4     4    10
# ... with 22 more rows
　1.5 匯總: summarise()

對數(shù)據(jù)框調用其它函數(shù)進行匯總操作, 返回一維的結果:

summarise(mtcars_df,
    mdisp = mean(disp, na.rm = TRUE))
# A tibble: 1 x 1
     mdisp
     <dbl>
1 230.7219
　1.6 分組: group_by()

當對數(shù)據(jù)集通過group_by()添加了分組信息后，mutate()，arrange() 和 summarise() 函數(shù)會自動對這些 tbl 類數(shù)據(jù)執(zhí)行分組操作。

cars <- group_by(mtcars_df, cyl)
countcars <- summarise(cars, count = n()) # count = n()用來計算次數(shù)

# A tibble: 3 x 2
    cyl count
<dbl> <int>
1     4    11
2     6     7
3     8    14
tidyr包基本操作

　2.1 寬轉長：gather()

使用gather()函數(shù)實現(xiàn)寬表轉長表，語法如下：

gather(data, key, value, …, na.rm = FALSE, convert = FALSE)
data：需要被轉換的寬形表
key：將原數(shù)據(jù)框中的所有列賦給一個新變量key
value：將原數(shù)據(jù)框中的所有值賦給一個新變量value
…：可以指定哪些列聚到同一列中
na.rm：是否刪除缺失值

widedata <- data.frame(person=c('Alex','Bob','Cathy'),grade=c(2,3,4),score=c(78,89,88))
widedata
person grade score
1   Alex     2    78
2    Bob     3    89
3 Cathy     4    88
longdata <- gather(widedata, variable, value,-person)
longdata
person variable value
1   Alex    grade     2
2    Bob    grade     3
3 Cathy    grade     4
4   Alex    score    78
5    Bob    score    89
6 Cathy    score    88
　2.2 長轉寬：spread()

有時，為了滿足建模或繪圖的要求，往往需要將長形表轉換為寬形表，或將寬形表變?yōu)殚L形表。如何實現(xiàn)這兩種數(shù)據(jù)表類型的轉換。使用spread()函數(shù)實現(xiàn)長表轉寬表，語法如下：

spread(data, key, value, fill = NA, convert = FALSE, drop = TRUE)
data：為需要轉換的長形表
key：需要將變量值拓展為字段的變量
value：需要分散的值
fill：對于缺失值，可將fill的值賦值給被轉型后的缺失值

mtcarsSpread <- mtcarsNew %>% spread(attribute, value)
head(mtcarsSpread)
                 car am carb cyl disp drat gear hp mpg qsec vs    wt
1        AMC Javelin 0    2   8 304 3.15    3 150 15.2 17.30 0 3.435
2 Cadillac Fleetwood 0    4   8 472 2.93    3 205 10.4 17.98 0 5.250
3         Camaro Z28 0    4   8 350 3.73    3 245 13.3 15.41 0 3.840
4 Chrysler Imperial 0    4   8 440 3.23    3 230 14.7 17.42 0 5.345
5         Datsun 710 1    1   4 108 3.85    4 93 22.8 18.61 1 2.320
6   Dodge Challenger 0    2   8 318 2.76    3 150 15.5 16.87 0 3.520
　2.3 合并：unit()

unite的調用格式如下：

unite(data, col, …, sep = “_”, remove = TRUE)
data：為數(shù)據(jù)框
col：被組合的新列名稱
…：指定哪些列需要被組合
sep：組合列之間的連接符，默認為下劃線
remove：是否刪除被組合的列

wideunite<-unite(widedata, information, person, grade, score, sep= "-")
wideunite
information
1   Alex-2-78
2    Bob-3-89
3 Cathy-4-88
　2.4 拆分：separate()

separate()函數(shù)可將一列拆分為多列，一般可用于日志數(shù)據(jù)或日期時間型數(shù)據(jù)的拆分，語法如下：

separate(data, col, into, sep = “[^[:alnum:]]+”, remove = TRUE,
convert = FALSE, extra = “warn”, fill = “warn”, …)
data：為數(shù)據(jù)框
col：需要被拆分的列
into：新建的列名，為字符串向量
sep：被拆分列的分隔符
remove：是否刪除被分割的列

widesep <- separate(wideunite, information,c("person","grade","score"), sep = "-")
widesep
person grade score
1   Alex     2    78
2    Bob     3    89
3 Cathy     4    88
可見separate()函數(shù)和unite()函數(shù)的功能相反。

CDA數(shù)據(jù)分析師考試相關入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

字段 R語言

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇圖論在大數(shù)據(jù)分析中的作用！

下一篇CDA認證再升一檔！與國家共同推進大數(shù)據(jù)人才培養(yǎng)標準教育事業(yè)！

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

京公網安備 11010802034615號經營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調，回調的第一個參數(shù)驗證碼對象，之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

R語言數(shù)據(jù)處理包dplyr、tidyr筆記

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報考條件詳解與準備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計的實用指南 ...

CDA 認證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務的價值轉化者 ...

SQL 在預測分析中的應用：從數(shù)據(jù)查詢到趨勢預判 ...

數(shù)據(jù)查詢結束后：分析師的收尾工作與價值深化 ...

CDA 數(shù)據(jù)分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數(shù)據(jù)背后的時間 ...

year_month數(shù)據(jù)類型：時間維度的精準切片 ...

CDA 備考干貨：Python 在數(shù)據(jù)分析中的核心應用與實 ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗：數(shù)據(jù)趨勢 ...

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應對策略 ...

統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用 ...

CDA數(shù)據(jù)分析師證書考試全攻略

剖析 CDA 數(shù)據(jù)分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉日期：解鎖數(shù)據(jù) ...

CDA 數(shù)據(jù)分析師視角：從數(shù)據(jù)迷霧中探尋商業(yè)真相 ...

CDA 數(shù)據(jù)分析師：開啟數(shù)據(jù)職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

R語言數(shù)據(jù)處理包dplyr、tidyr筆記

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報考條件詳解與準備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計的實用指南 ...

CDA 認證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務的價值轉化者 ...

SQL 在預測分析中的應用：從數(shù)據(jù)查詢到趨勢預判 ...

數(shù)據(jù)查詢結束后：分析師的收尾工作與價值深化 ...

CDA 數(shù)據(jù)分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數(shù)據(jù)背后的時間 ...

year_month數(shù)據(jù)類型：時間維度的精準切片 ...

CDA 備考干貨：Python 在數(shù)據(jù)分析中的核心應用與實 ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗：數(shù)據(jù)趨勢 ...

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應對策略 ...

統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用 ...

CDA數(shù)據(jù)分析師證書考試全攻略

剖析 CDA 數(shù)據(jù)分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉日期：解鎖數(shù)據(jù) ...

CDA 數(shù)據(jù)分析師視角：從數(shù)據(jù)迷霧中探尋商業(yè)真相 ...

CDA 數(shù)據(jù)分析師：開啟數(shù)據(jù)職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

【CDA干貨】LSTM 輸出不確定的成因、影響與應對策略 ...