99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀幾招教你如何在R語言中獲取數(shù)據(jù)進行分析
幾招教你如何在R語言中獲取數(shù)據(jù)進行分析
2015-03-23
收藏

幾招教你如何在R語言中獲取數(shù)據(jù)進行分析


如今,想要購買一部手機已成為一件非常具有挑戰(zhàn)性的事,這點很好理解。因為要在如此多的款型和品牌中選擇并確定符合最終需求的那款手機, 需要進行深入的產(chǎn)品研究并理解產(chǎn)品的功能。有趣的是,一些產(chǎn)品評論和價格比較,可供用戶自由填寫和選擇,以幫助消費者作出正確的選擇。而實際積累的數(shù)據(jù)也 為消費者對產(chǎn)品決策和最終決定是否購買方面也起了重要作用。作為消費者,尋找合適的數(shù)據(jù)是一個十分復(fù)雜的過程。這樣一來,R語言就有了用武之地。使用R語 言進行編程,開發(fā)者可以用一個腳本快速繪制統(tǒng)計出適合自己的分析。下面,讓我們看看R編程的一些特性和用法。

R語言進行數(shù)據(jù)處理的不同方法:

R可以從以下幾個方面讀取數(shù)據(jù):

·電子數(shù)據(jù)表

·Excel

·數(shù)據(jù)庫

·圖片

·文本文件

·其他特殊格式

導(dǎo)入數(shù)據(jù)

不論是本地數(shù)據(jù)還是網(wǎng)上數(shù)據(jù),使用R編程都將能夠成功地導(dǎo)入不同格式的數(shù)據(jù)。

從文件中讀取數(shù)據(jù)

理想情況下,數(shù)據(jù)是可以儲存在文件系統(tǒng)中的。這些數(shù)據(jù)必須可讀或?qū)?,用以識別當(dāng)前目錄中儲存的文件。

·目錄設(shè)置

首當(dāng)其沖的就是設(shè)置工作目錄。

使用命令getwd()來確定目錄(文件夾)

linux pc輸出顯示的路徑如下:

> getwd()

[1] “/home/test”

Windows上描述為:

c:\data\test

設(shè)置數(shù)據(jù)文件的保存目錄,使用命令setwd(“路徑”),路徑數(shù)據(jù)文件所在的目錄和子目錄。例如,如果數(shù)據(jù)在文件temp.txt且此文件在文件夾/home/test/example/,那么在linux上表示為:

setwd("/home/test/example/")

Windows上,它將被表示為:

setwd("C: \mydata\test")

這里,有必要知道文件所保存的文件夾地址。

·讀取文本文件

包含在文本文件的數(shù)據(jù)可以在R會話時使用掃描命令讀取。

記住使用選項what= ” “掃描命令,這表明輸入的字符將帶有數(shù)據(jù)類型屬性。

對于這個session,我已經(jīng)創(chuàng)建了textsample.txtfile文件,它可以在R會話中讀取。

> fdata<- scan("textsample.txt",what="")

現(xiàn)在,fdata將從文本文件中獲取數(shù)據(jù)。

讓我們先來回顧一些head(fdata)條目命令:

> head(fdata)

[1] "this"      "is"        "a"         "sample"    "file"      "generated"

使用tolower將字符串轉(zhuǎn)換成小寫字母。

> fdata<-tolower(fdata)

文件中許多都是單獨存儲,其中存在一些重復(fù)詞匯。

計算詞的使用頻率

 > ft<-table(fdata)

查看ft的餅圖情況使用命令:

 > pie(ft)

從上面的圖表可以看出,“file”“the”的使用頻率最高。

通過max命令可以很容易發(fā)現(xiàn)在英國《金融時報》使用頻率最大的單詞。

> max(ft)

[1] 4

查看該命令的輸出:

> head(ft)

fdata

a        be        by       can character   command

1         3         1           2             1             1

圖中點繪處顯示單詞在頻率圖對應(yīng)的位置:

> dotchart(ft)

·讀取文件數(shù)據(jù)的命令

大家都知道,一些最常見的數(shù)據(jù)文件都是csvxls格式文件。csv文件用逗號分隔值,xls是一個excel文件擴展名。

一些最常見的數(shù)據(jù)文件格式,可以通過read.csvread.table命令處理:

> read.csv("test.csv",header=TRUE)

1  Status   Age    V1     V2     V3    V4

2       P 23646 45190  50333  55166 56271

3      CC 26174 35535  38227  37911 41184

4      CC 27723 25691  25712  26144 26398

5      CC 27193 30949  29693  29754 30772

6      CC 24370 50542  51966  54341 54273

7      CC 28359 58591  58803  59435 61292

8      CC 25136 45801  45389  47197 47126

> read.table("test.csv",header=TRUE)

Status   Age    V1    V2    V3    V4

1      P 23646 45190 50333 55166 56271

2     CC 26174 35535 38227 37911 41184

3     CC 27723 25691 25712 26144 26398

4     CC 27193 30949 29693 29754 30772

5     CC 24370 50542 51966 54341 54273

6     CC 28359 58591 58803 59435 61292

7     CC 25136 45801 45389 47197 47126

 ·直接從網(wǎng)上獲取數(shù)據(jù)

大家可以直接從網(wǎng)上讀取數(shù)據(jù)。這些數(shù)據(jù)可通過網(wǎng)站鏈接獲取,或通過R記憶URL直接獲得數(shù)據(jù)。網(wǎng)絡(luò)上的數(shù)據(jù)設(shè)置可登錄http://lib.statNaNu.edu/datasets/csb/ch3a.dat。輸入read.csvread.table命令直接讀取數(shù)據(jù)。

data1<-read.table( "http://lib.statNaNu.edu/datasets/csb/ch3a.dat")

> head(data1)

        V1    V2    V3    V4    V5

1 07/08/91 47.33 52.82 19.58 17.78

2 07/09/91 42.58 53.25  9.42  6.06

3 07/10/91 59.55 56.32 19.83 14.81

4 07/11/91 52.92 50.06 15.08  9.75

5 07/12/91 55.25 59.50 28.75 27.21

6 07/13/91 54.75 56.80 27.83 20.84

data2<-read.csv( "http://lib.statNaNu.edu/datasets/csb/ch3a.dat")

> head(data2)

  X07.08.91....47.33....52.82....19.58....17.78

1  07/09/91    42.58    53.25     9.42     6.06

2  07/10/91    59.55    56.32    19.83    14.81

3  07/11/91    52.92    50.06    15.08     9.75

4  07/12/91    55.25    59.50    28.75    27.21

5  07/13/91    54.75    56.80    27.83    20.84

6  07/14/91    35.33    40.88    11.83    15.65

data1以及data2是持有相同的文件不同格式的兩個數(shù)據(jù)對象。

Reading Spreadsheets

·閱讀電子表格

閱讀電子表格數(shù)據(jù),我們需要安裝gdata庫。

> install.packages("gdata")

> library(gdata)

讀取這個包的數(shù)據(jù),可使用新命令read.xls

The data file test.xls can be read with read.xls(“test.xls”).

數(shù)據(jù)文件test.xls可輸入命令read.xls xls(“test.xls”)讀取。

Fill Spread Sheet Type Data Through the Editor in R

通過編輯R填補傳播表類型數(shù)據(jù)

x<-edit(as.data.frame(NULL))

R中的數(shù)據(jù)集

可以使用顯示R中的數(shù)據(jù)集的命令data()將可用數(shù)據(jù)集置入R中。

data(Airpassengers)

查看數(shù)據(jù)描述,使用命令:

help(AirPassengers)

查看實際數(shù)據(jù),使用head命令:

> head(AirPassengers) 

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }