99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀R語言實用小技巧
R語言實用小技巧
2018-03-09
收藏

R語言實用小技巧

這篇文章介紹的是我平時寫程序遇到的各種小問題,以及解決他們的小技巧
1.R語言讀取EXCEL
R語言讀取EXCEL時,可以使用readxl包的read_excel函數(shù),不要使用xlsx這個包,因為xlsx它要加載JAVA,很麻煩,而使用readxl不需要加載JAVA。

2.如何在R中構造一個hash函數(shù)
這在R中或許有許多包能夠實現(xiàn),但是,其實我們自己來實現(xiàn)也是很簡單的,要知道environment的原理也是一個hash函數(shù),我們只需要利用environment,來負責存儲我們所需要的映射列表就可以了。接下來我們可以利用digest包的散列函數(shù)digest(),這個函數(shù)可以將任意的R對象映射為一個md5值,或者sha1等,他的md5值就是我們所需要的key,以下是使用例子:
有如下這樣的數(shù)據(jù)
> df<-data.frame(x=1:4,y=2:5,z=3:6,k=4:7)
> df
  x y z k
1 1 2 3 4
2 2 3 4 5
3 3 4 5 6
4 4 5 6 7
假設我想將x,y映射到z,將y,z映射為k,先定義兩個函數(shù),一個是SetKeyValue,負責設置key,value對,第二個是GetValue,輸入一個key,返回key對應的value。
library(digest)
SetKeyValue<-function(envir,key,value){
  envir[[digest(key)]]<-value
  return(envir)
}
GetValue<-function(envir,key){
  return(envir[[digest(key)]])
}

hash<-new.env()
for(i in 1:nrow(df)){
  hash<-SetKeyValue(hash,df[i,1:2],df[i,3])
  hash<-SetKeyValue(hash,df[i,2:3],df[i,4])
}

這樣我們就得到了一個由environment構造的hash函數(shù)了,我們可以這樣去得到值:

> GetValue(hash,df[1,1:2]) #得到當x=1 y=2時的z值
[1] 3

當然,如果想要更快的速度,可以使用fastdigest這個包,里面的散列函數(shù)比digest包要快,只需將digest()替換成fastdigest()就可以了。
3.如何用最快最簡單的方法加快R的執(zhí)行速度?

答案是使用compiler包,這個包的作用就是將R代碼編譯成字節(jié)碼,這在很多情況下都能加快運行的速度,當然也會有一些時候作用沒有那么大,使用非常簡單,以下是一個使用例子:

> library(microbenchmark)
> library(compiler)
> f1<-function(){
+   x=1:100
+   for(i in 1:100){
+     x[i]=x[i]+1
+   }
+ }
> f2<-function(){
+   x=1:100
+   x+1
+ }
> f3<-cmpfun(f1)
> f4<-cmpfun(f2)
> microbenchmark(
+   f1(),
+   f2(),
+   f3(),
+   f4()
+ )
Unit: nanoseconds
 expr    min     lq      mean median     uq    max neval cld
 f1() 170077 175453 178277.64 177652 179363 227746   100   c
 f2()    978   1467   2028.94   1956   2444   5865   100 a  
 f3()  11730  12219  12873.79  12708  13196  20039   100  b
 f4()    978   1466   1564.65   1467   1955   2933   100 a  

可以看到編譯后的f3,f4跟編譯前的f1,f2,快了將近2倍到10倍,這么簡單就能提升運行速度,何樂而不為呢?
我寫的一個小代碼,可以批量地把環(huán)境變量中所有的函數(shù)都編譯一次:

funlist<-c(lsf.str())
for(f in funlist){
  assign(f,cmpfun(get(f)))
}

如何想要更快,可以參考Windows使用OpenBLAS加速R語言計算速度
4.如何讀取一個文件夾所有的文件?

我們可以利用list.files進行匹配,通過其中參數(shù)pattern可以填寫正則表達式,用來匹配文件夾下滿足條件的文件名。然后再利用lapply來導入文件。

filenames <- list.files("C:/Users/qj/Desktop/demo_data/", pattern = ".txt")

datalist <- lapply(filenames, function(name) {
  read.table(paste0("C:/Users/qj/Desktop/demo_data/", name),sep=',',header = T)
})

5.如何把data.frame按照行來對應生成列表

> set.seed(1)
> df <- data.frame(i=3:1,  y = runif(3))
> df
  i         y
1 3 0.2655087
2 2 0.3721239
3 1 0.5728534

我想把這個data.frame變成一個list 并且i要與list中的序號對應。
解決方法如下:

> i=df$i
> df=df[,2]
> dflist<-split(df,i)
> names(dflist)<-NULL
> dflist
[[1]]
[1] 0.5728534

[[2]]
[1] 0.3721239

[[3]]
[1] 0.2655087

6.如何標記每個組別中出現(xiàn)的次數(shù),他們出現(xiàn)的順序。

有這么個數(shù)據(jù):

> df=data.frame(group=c(1,1,2,2,3,3,3))
> df
  group
1     1
2     1
3     2
4     2
5     3
6     3
7     3
現(xiàn)在想添加一列,標記的id列,讓它變成:
   group id
1:     1  1
2:     1  2
3:     2  1
4:     2  2
5:     3  1
6:     3  2
7:     3  3
可以利用data.table實現(xiàn):
> dt<-data.table(df)
> dt[,id:=1:.N,by=group]
> dt
   group id
1:     1  1
2:     1  2
3:     2  1
4:     2  2
5:     3  1
6:     3  2
7:     3  3
7.R語言讀取SPSS格式文件
可以使用library(memisc)這個包,雖然foreign也能做到,但是有的時候格式會很混亂,而memisc就可以完美讀取。
8.R語言for循環(huán)的小貼士
看一個例子,這個例子是一個簡單的for循環(huán),它在大部分情況下是沒有任何問題的。
n=nrow(x)
for(i in 1:n){
x[i]
}
但是如果當x是一個空值時,這就會出問題了,當x是空值時,我們并不希望這個for循環(huán)會執(zhí)行,但是在這里n=0,那么i in 1:0 就會產(chǎn)生1和0,這就會導致出現(xiàn)各種各樣的錯誤,而且這些錯誤并不固定,它會隨著你的for循環(huán)里面的內容改變而改變,從而很難定位bug的所在。一個解決的方法是,我們可以使用seq.int(length.out = n)循環(huán)來代替1:n

n=nrow(x)
for(i in seq.int(length.out = n)){
x[i]
}

這樣當n=0的時候,這個循環(huán)就不會執(zhí)行了。
9.使用foreach包并行計算時看到里面print的方法
在linux的時候,我們可以在makeCluster上加上outfile="" 使用""就會默認輸出到控制臺,不過這個功能在windows好像不能用,在windows的時候建議輸出到文件里,outfile="d:/log.txt",這樣就可以了。
library(parallel)
library(foreach)
library(doParallel)
cl<-makeCluster(2,outfile="d:/log.txt") #work for windows
cl<-makeCluster(2,outfile="") #work for linux
registerDoParallel(cl)
x <- foreach(i=1:100,.combine = rbind,.inorder = F) %dopar% {
  print(i)
  sqrt(i)
}
stopCluster(cl)

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師考試動態(tài)
數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調,回調的第一個參數(shù)驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }