99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

R語(yǔ)言實(shí)用小技巧

2018-03-09

R語(yǔ)言實(shí)用小技巧

這篇文章介紹的是我平時(shí)寫(xiě)程序遇到的各種小問(wèn)題，以及解決他們的小技巧
1.R語(yǔ)言讀取EXCEL
用 R語(yǔ)言讀取EXCEL時(shí)，可以使用readxl包的read_excel函數(shù)，不要使用xlsx這個(gè)包，因?yàn)閤lsx它要加載JAVA，很麻煩，而使用readxl不需要加載JAVA。

2.如何在R中構(gòu)造一個(gè)hash函數(shù)
這在R中或許有許多包能夠?qū)崿F(xiàn)，但是，其實(shí)我們自己來(lái)實(shí)現(xiàn)也是很簡(jiǎn)單的，要知道environment的原理也是一個(gè)hash函數(shù)，我們只需要利用environment，來(lái)負(fù)責(zé)存儲(chǔ)我們所需要的映射列表就可以了。接下來(lái)我們可以利用digest包的散列函數(shù)digest(),這個(gè)函數(shù)可以將任意的R對(duì)象映射為一個(gè)md5值，或者sha1等，他的md5值就是我們所需要的key，以下是使用例子：
有如下這樣的數(shù)據(jù)
> df<-data.frame(x=1:4,y=2:5,z=3:6,k=4:7)
> df
x y z k
1 1 2 3 4
2 2 3 4 5
3 3 4 5 6
4 4 5 6 7
假設(shè)我想將x,y映射到z，將y,z映射為k，先定義兩個(gè)函數(shù)，一個(gè)是SetKeyValue，負(fù)責(zé)設(shè)置key,value對(duì)，第二個(gè)是GetValue，輸入一個(gè)key，返回key對(duì)應(yīng)的value。
library(digest)
SetKeyValue<-function(envir,key,value){
envir[[digest(key)]]<-value
return(envir)
}
GetValue<-function(envir,key){
return(envir[[digest(key)]])
}

hash<-new.env()
for(i in 1:nrow(df)){
hash<-SetKeyValue(hash,df[i,1:2],df[i,3])
hash<-SetKeyValue(hash,df[i,2:3],df[i,4])
}

這樣我們就得到了一個(gè)由environment構(gòu)造的hash函數(shù)了，我們可以這樣去得到值：

> GetValue(hash,df[1,1:2]) #得到當(dāng)x=1 y=2時(shí)的z值
[1] 3

當(dāng)然，如果想要更快的速度，可以使用fastdigest這個(gè)包，里面的散列函數(shù)比digest包要快，只需將digest()替換成fastdigest()就可以了。
3.如何用最快最簡(jiǎn)單的方法加快R的執(zhí)行速度？

答案是使用compiler包，這個(gè)包的作用就是將R代碼編譯成字節(jié)碼，這在很多情況下都能加快運(yùn)行的速度，當(dāng)然也會(huì)有一些時(shí)候作用沒(méi)有那么大，使用非常簡(jiǎn)單，以下是一個(gè)使用例子：

> library(microbenchmark)
> library(compiler)
> f1<-function(){
+ x=1:100
+ for(i in 1:100){
+ x[i]=x[i]+1
+ }
+ }
> f2<-function(){
+ x=1:100
+ x+1
+ }
> f3<-cmpfun(f1)
> f4<-cmpfun(f2)
> microbenchmark(
+ f1(),
+ f2(),
+ f3(),
+ f4()
+ )
Unit: nanoseconds
expr min lq mean median uq max neval cld
f1() 170077 175453 178277.64 177652 179363 227746 100 c
f2() 978 1467 2028.94 1956 2444 5865 100 a
f3() 11730 12219 12873.79 12708 13196 20039 100 b
f4() 978 1466 1564.65 1467 1955 2933 100 a

可以看到編譯后的f3,f4跟編譯前的f1,f2,快了將近2倍到10倍，這么簡(jiǎn)單就能提升運(yùn)行速度，何樂(lè)而不為呢？
我寫(xiě)的一個(gè)小代碼，可以批量地把環(huán)境變量中所有的函數(shù)都編譯一次：

funlist<-c(lsf.str())
for(f in funlist){
assign(f,cmpfun(get(f)))
}

如何想要更快，可以參考Windows使用OpenBLAS加速R語(yǔ)言計(jì)算速度
4.如何讀取一個(gè)文件夾所有的文件？

我們可以利用list.files進(jìn)行匹配，通過(guò)其中參數(shù)pattern可以填寫(xiě)正則表達(dá)式，用來(lái)匹配文件夾下滿足條件的文件名。然后再利用lapply來(lái)導(dǎo)入文件。

filenames <- list.files("C:/Users/qj/Desktop/demo_data/", pattern = ".txt")

datalist <- lapply(filenames, function(name) {
read.table(paste0("C:/Users/qj/Desktop/demo_data/", name),sep=',',header = T)
})

5.如何把data.frame按照行來(lái)對(duì)應(yīng)生成列表

> set.seed(1)
> df <- data.frame(i=3:1, y = runif(3))
> df
i y
1 3 0.2655087
2 2 0.3721239
3 1 0.5728534

我想把這個(gè)data.frame變成一個(gè)list 并且i要與list中的序號(hào)對(duì)應(yīng)。
解決方法如下：

> i=df$i
> df=df[,2]
> dflist<-split(df,i)
> names(dflist)<-NULL
> dflist
[[1]]
[1] 0.5728534

[[2]]
[1] 0.3721239

[[3]]
[1] 0.2655087

6.如何標(biāo)記每個(gè)組別中出現(xiàn)的次數(shù)，他們出現(xiàn)的順序。

有這么個(gè)數(shù)據(jù)：

> df=data.frame(group=c(1,1,2,2,3,3,3))
> df
group
1 1
2 1
3 2
4 2
5 3
6 3
7 3
現(xiàn)在想添加一列，標(biāo)記的id列，讓它變成：
 group id
1: 1 1
2: 1 2
3: 2 1
4: 2 2
5: 3 1
6: 3 2
7: 3 3
可以利用data.table實(shí)現(xiàn)：
> dt<-data.table(df)
> dt[,id:=1:.N,by=group]
> dt
 group id
1: 1 1
2: 1 2
3: 2 1
4: 2 2
5: 3 1
6: 3 2
7: 3 3
7.R語(yǔ)言讀取SPSS格式文件
可以使用library(memisc)這個(gè)包，雖然foreign也能做到，但是有的時(shí)候格式會(huì)很混亂，而memisc就可以完美讀取。
8.R語(yǔ)言for循環(huán)的小貼士
看一個(gè)例子，這個(gè)例子是一個(gè)簡(jiǎn)單的for循環(huán)，它在大部分情況下是沒(méi)有任何問(wèn)題的。
n=nrow(x)
for(i in 1:n){
x[i]
}
但是如果當(dāng)x是一個(gè)空值時(shí)，這就會(huì)出問(wèn)題了，當(dāng)x是空值時(shí)，我們并不希望這個(gè)for循環(huán)會(huì)執(zhí)行，但是在這里n=0，那么i in 1:0 就會(huì)產(chǎn)生1和0，這就會(huì)導(dǎo)致出現(xiàn)各種各樣的錯(cuò)誤，而且這些錯(cuò)誤并不固定，它會(huì)隨著你的for循環(huán)里面的內(nèi)容改變而改變，從而很難定位bug的所在。一個(gè)解決的方法是，我們可以使用seq.int(length.out = n)循環(huán)來(lái)代替1:n

n=nrow(x)
for(i in seq.int(length.out = n)){
x[i]
}

這樣當(dāng)n=0的時(shí)候，這個(gè)循環(huán)就不會(huì)執(zhí)行了。
9.使用foreach包并行計(jì)算時(shí)看到里面print的方法
在linux的時(shí)候，我們可以在makeCluster上加上outfile="" 使用""就會(huì)默認(rèn)輸出到控制臺(tái)，不過(guò)這個(gè)功能在windows好像不能用，在windows的時(shí)候建議輸出到文件里，outfile="d:/log.txt"，這樣就可以了。
library(parallel)
library(foreach)
library(doParallel)
cl<-makeCluster(2,outfile="d:/log.txt") #work for windows
cl<-makeCluster(2,outfile="") #work for linux
registerDoParallel(cl)
x <- foreach(i=1:100,.combine = rbind,.inorder = F) %dopar% {
print(i)
sqrt(i)
}
stopCluster(cl)

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報(bào)名CDA認(rèn)證考試，點(diǎn)擊>>> “CDA報(bào)名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點(diǎn)擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫(kù)，點(diǎn)擊>>> “CDA題庫(kù)” 了解CDA考試詳情；

? 想了解CDA考試含金量，點(diǎn)擊>>> “CDA含金量” 了解CDA考試詳情；

R語(yǔ)言正則表達(dá)式

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼，搜微信號(hào)：CDAshujufenxi

上一篇python新式類(lèi)和經(jīng)典類(lèi)的區(qū)別

下一篇有一份讓吳恩達(dá)稱(chēng)贊的深度學(xué)習(xí)的課程筆記，請(qǐng)注意查收

CDA報(bào)考指南

報(bào)考流程
考試時(shí)間
報(bào)名費(fèi)用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號(hào) 經(jīng)營(yíng)許可證編號(hào)：京B2-20210330

聯(lián)系電話：13321103290 (微信同號(hào))

CDA教材
CDA題庫(kù)
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

^{}

免密碼登錄

提交首次登錄驗(yàn)證后自動(dòng)注冊(cè)

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn)：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

R語(yǔ)言實(shí)用小技巧

數(shù)據(jù)分析師考試動(dòng)態(tài)

CDA報(bào)考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗(yàn)與 t 檢驗(yàn)：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè) ...

【CDA干貨】MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對(duì)象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 ...

【CDA干貨】Python HTTP 請(qǐng)求工具對(duì)比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu) ...

【CDA干貨】用 SQL 驗(yàn)證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營(yíng)銷(xiāo)案例：數(shù)據(jù)驅(qū)動(dòng)下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類(lèi)分析：從操作實(shí)踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計(jì)模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見(jiàn)問(wèn)題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號(hào)

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

R語(yǔ)言實(shí)用小技巧

數(shù)據(jù)分析師考試動(dòng)態(tài)

CDA報(bào)考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換 ...

【CDA干貨】MySQL 大表拆分與關(guān)聯(lián)查詢效率：打破 “ ...

CDA 數(shù)據(jù)分析師：表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用 ...

【CDA干貨】DSGE 模型中的 Et：理性預(yù)期算子的內(nèi)涵 ...

【CDA干貨】Python 提取 TIF 中地名的完整指南 ...

CDA 數(shù)據(jù)分析師：解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 ...

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗(yàn)與 t 檢驗(yàn)：差異、適用 ...

CDA 數(shù)據(jù)分析師：掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè) ...

【CDA干貨】MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解 ...

【CDA干貨】解析 Python 中 Response 對(duì)象的 text ...

CDA 數(shù)據(jù)分析師：激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 ...

【CDA干貨】Python HTTP 請(qǐng)求工具對(duì)比：urllib.requ ...

【CDA干貨】解決 pd.read\_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科 ...

CDA 數(shù)據(jù)分析師：業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu) ...

【CDA干貨】用 SQL 驗(yàn)證業(yè)務(wù)邏輯：從規(guī)則拆解到數(shù)據(jù) ...

【CDA干貨】塔吉特百貨孕婦營(yíng)銷(xiāo)案例：數(shù)據(jù)驅(qū)動(dòng)下的 ...

CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析：概念辨析與 ...

【CDA干貨】Excel 數(shù)據(jù)聚類(lèi)分析：從操作實(shí)踐到業(yè)務(wù) ...

【CDA干貨】統(tǒng)計(jì)模型的核心目的：從數(shù)據(jù)解讀到?jīng)Q策 ...

CDA教育閉環(huán)

常見(jiàn)問(wèn)題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號(hào)

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

【CDA干貨】Excel 導(dǎo)入數(shù)據(jù)含缺失值？詳解 dropna ...

【CDA干貨】深入解析卡方檢驗(yàn)與 t 檢驗(yàn)：差異、適用 ...