99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀數(shù)據挖掘-R語言編程技巧
數(shù)據挖掘-R語言編程技巧
2016-06-13
收藏

本文內容摘自CDA數(shù)據科學家訓練營數(shù)據挖掘R語言課程。

【基本操作】


清空工作臺:rm(list=ls())


清除內存:gc()


看幫助:library(help="fpc")


做完函數(shù)直接輸出:(centered<-scale(x,scale=FALSE))   直接外加括號即可


CPU運行時間:systerm.time()


看數(shù)據第一行:head()


看最佳迭代次數(shù):best.iter()


打印輸出:print(paste("K=",i))


導出文件:sink(file="m.txt")  寫入文件

                    sink()   關閉文件

【數(shù)據預處理】


隨機取樣:dat.test<-dat.scale[sample(nrow(dat.scale),1000),]  不放回隨機取樣


查看數(shù)據類型:str(dat)

統(tǒng)計缺失值:

View(data.frame(apply(dat,2,function(x) sum(is.na(x)))))

View(data.frame(sapply(data.function(x) sum(is.na(x)))))

改變變量名:top$Name="Top 5"

                        within函數(shù)

                        transform函數(shù)

                        mutate函數(shù)

    (可以讓每行代碼簡潔)


取子類:

trainx<-train[,!names(train)%in%c('rid','segment','var_bin','var_bin2')]   正確方法

trainx<-train[,!names(,c('rid','segment','var_bin','var_bin2')]   錯誤方法,不能直接刪除變量名代表的列

dat.sub<-dat[,substr(names(dat),1,3)=="R1_"]

利用字符串截取函數(shù),截取第1到3個字母,與R1比較(適用于變量名稱較統(tǒng)一,數(shù)據庫中有若干種不同類型的數(shù)據)

scale函數(shù):與apply(x,2,sd)作用一致,按列求方差,最后只有一行,而SCALE則是對全體數(shù)據都標準化

加入一列:clus<-data.frame(cluster=cluster.km$cluster,dat.sub)

加入的列名為cluster,數(shù)據為聚類后的分類名


【字符串操作】


字符串截?。簊ubstr(name(dat),1,3)

字符串截取函數(shù):

dat.sub<-dat[,substr(names(dat),1,3)=="R1_"]


【特定數(shù)據選擇及處理】

篩選前5名:top5=head(chinapm[order(chinapm$PM,decreasing=T),],5)

分組求和/平均:

sqldf包   利用sql求和

aggregate函數(shù) :

clus_profile<-aggregate(,-cluster,data=clus,FUN=mean)  子主題

aggregate(formula,data,FUN)

plyr包

dply包

利用factor

行列求和/平均:

colSums(dat.scale)

rowMeans

【繪圖】

柱狀圖:hist(dat$R1_MV001  可用來數(shù)據的初步探索

折線圖:plot(x,y,type)  type:p-points,l-line,b-both

plot(1:10,wss,type="b",xlab="Number of Cluster",ylab="Within groups sum of squares"

決策樹

決策樹是一種預測模型,同時也能能處理缺失值

隨機森林

不能處理缺失值,隨機選擇變量

線性回歸

glm包:需要手動選擇進入模型的變量


glmnet包:加強版,自動選擇進入模型的變量

【關聯(lián)分析】

arules包: Apriori算法,Mining Associations with Apriori

【多次跑】

set.seed(12345)

【啞變量】

即虛擬變量(Dummy Variable),又稱虛設變量、名義變量,是量化了的質變量,通常取值為0或1


數(shù)據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調,回調的第一個參數(shù)驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }