99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀R語言實戰(zhàn):R語言介紹
R語言實戰(zhàn):R語言介紹
2016-10-12
收藏

R語言實戰(zhàn):R語言介紹

我們分析數(shù)據的方式在近年來發(fā)生了令人矚目的變化。隨著個人電腦和互聯(lián)網的出現(xiàn),可獲取的數(shù)據量有了非??捎^的增長。

商業(yè)公司擁有TB級的客戶交易數(shù)據,政府、學術團體以及私立研究機構同樣擁有各類研究課題的大量檔案和調查數(shù)據。從這些海量數(shù)據中收集信息(更不用說發(fā)現(xiàn)規(guī)律)已經成為了一項產業(yè)。同時,如何以容易讓人理解和消化的方式呈現(xiàn)這些信息也日益富有挑戰(zhàn)性。

數(shù)據分析科學(統(tǒng)計學、計量心理學、計量經濟學、機器學習)的發(fā)展一直與數(shù)據的爆炸式增長保持同步。遠在個人電腦和互聯(lián)網發(fā)端之前,學術研究人員就已經開發(fā)出了很多新的統(tǒng)計方法,并將其研究成果以論文的形式發(fā)表在專業(yè)期刊上。這些方法可能需要很多年才能夠被程序員改寫并整合到廣泛用于數(shù)據分析的統(tǒng)計軟件中。而如今,新的方法層出不窮。統(tǒng)計研究者經常在人們常訪問的網站上發(fā)表新方法和改進的方法,并附上相應的實現(xiàn)代碼。

個人電腦的出現(xiàn)還對我們分析數(shù)據的方式產生了另外一種影響。當數(shù)據分析需要在大型機上完成的時候,機時非常寶貴難求。分析師們會小心地設定可能用到的所有參數(shù)和選項,再讓計算機執(zhí)行計算。程序運行完畢后,輸出的結果可能長達幾十甚至幾百頁。之后,分析師會仔細篩查整個輸出,去蕪存菁。許多受歡迎的統(tǒng)計軟件正是在這個時期開發(fā)出來的。直到現(xiàn)在,統(tǒng)計軟件依然在一定程度上沿襲了這種處理方式。

隨著個人電腦將計算變得廉價且便捷,現(xiàn)代數(shù)據分析的方式發(fā)生了變化。與過去一次性設置好完整的數(shù)據分析過程不同,現(xiàn)在這個過程已經變得高度交互化,每一階段的輸出都可以充當下一階段的輸入。一個典型的數(shù)據分析過程的示例見圖1-1。在任何時刻,這個循環(huán)都可能在進行著數(shù)據變換、缺失值插補、變量增加或刪除,甚至重新執(zhí)行整個過程。當分析師認為他已經深入地理解了數(shù)據,并且可以回答所有能夠回答的相關問題時,這個過程即告結束。

個人電腦的出現(xiàn)(特別是高分辨率顯示器的普及)同樣對理解和呈現(xiàn)分析結果產生了重大影響。一圖勝千言,絕對如此!人類非常擅長通過視覺獲取有用信息?,F(xiàn)代數(shù)據分析也日益依賴通過呈現(xiàn)圖形來揭示含義和表達結果。

<a href='/map/r/' style='color:#000;font-size:inherit;'>R語言</a>實戰(zhàn):<a href='/map/r/' style='color:#000;font-size:inherit;'>R語言</a>介紹

總而言之,今天的數(shù)據分析人士需要從廣泛的數(shù)據源(數(shù)據庫管理系統(tǒng)、文本文件、統(tǒng)計軟件以及電子表格)獲取數(shù)據、將數(shù)據片段融合到一起、對數(shù)據做清理和標注、用最新的方法進行分析、以有意義有吸引力的圖形化方式展示結果,最后將結果整合成令人感興趣的報告并向利益相關者和公眾發(fā)布。通過下面的介紹你會看到, R正是一個適合完成以上目標的理想而又功能全面的軟件。

1.1 為何要使用 R語言?

與起源于貝爾實驗室的S語言類似, R語言也是一種為統(tǒng)計計算和繪圖而生的語言和環(huán)境,它是一套開源的數(shù)據分析解決方案,由一個龐大且活躍的全球性研究型社區(qū)維護。但是,市面上也有許多其他流行的統(tǒng)計和制圖軟件,如Microsoft Excel、 SAS、 IBM SPSS、 Stata以及Minitab。為何偏偏要選擇R?

R有著非常多值得推薦的特性。

多數(shù)商業(yè)統(tǒng)計軟件價格不菲,投入成千上萬美元都是可能的。而R是免費的!如果你是一位教師或一名學生,好處顯而易見。

R語言是一個全面的統(tǒng)計研究平臺,提供了各式各樣的數(shù)據分析技術。幾乎任何類型的數(shù)據分析工作皆可在R中完成。

R語言擁有頂尖水準的制圖功能。如果希望復雜數(shù)據可視化,那么R擁有最全面且最強大的一系列可用功能。

R語言是一個可進行交互式數(shù)據分析和探索的強大平臺。其核心設計理念就是支持圖1-1中所概述的分析方法。舉例來說,任意一個分析步驟的結果均可被輕松保存、操作,并作為進一步分析的輸入。

從多個數(shù)據源獲取并將數(shù)據轉化為可用的形式,可能是一個富有挑戰(zhàn)性的議題。 R可以輕松地從各種類型的數(shù)據源導入數(shù)據,包括文本文件、數(shù)據庫管理系統(tǒng)、統(tǒng)計軟件,乃至專門的數(shù)據倉庫。它同樣可以將數(shù)據輸出并寫入到這些系統(tǒng)中。

R是一個無與倫比的平臺,在其上可使用一種簡單而直接的方式編寫新的統(tǒng)計方法。它易于擴展,并為快速編程實現(xiàn)新方法提供了一套十分自然的語言。

R囊括了在其他軟件中尚不可用的、先進的統(tǒng)計計算例程。事實上,新方法的更新速度是以周來計算的。如果你是一位SAS用戶,想象一下每隔幾天就獲得一個新SAS過程的情景。

如果你不想學習一門新的語言,有各式各樣的GUI(Graphical User Interface,圖形用戶界面)工具通過菜單和對話框提供了與R語言同等的功能。

R可運行于多種平臺之上,包括Windows、 UNIX和Mac OS X。這基本上意味著它可以運行于你所能擁有的任何計算機上。(本人曾在偶然間看到過在iPhone上安裝R的教程,讓人佩服,但這也許不是一個好主意。)

圖1-2是展示R語言制圖功能的一個示例。使用一行代碼做出的這張圖,說明了藍領工作、白領工作和專業(yè)工作在收入、受教育程度以及職業(yè)聲望方面的關系。從專業(yè)角度講,這是一幅使用不同的顏色和符號表示不同分組的散點圖矩陣,帶有兩類擬合曲線(線性回歸和局部加權回歸) 、置信橢圓以及兩種對密度的展示(核密度估計和軸須圖)。另外,在每個散點圖中都自動標出了值最大的離群點。如果這些術語對你來說很陌生也不必擔心。我們將在后續(xù)各章中陸續(xù)談及它們。這里請暫且相信我,它們真的非常酷。(搞統(tǒng)計的人讀到這里時估計已經垂涎三尺了。)圖1-2主要表明了以下幾點。

受教育程度(education)、收入(income)、職業(yè)聲望(prestige)呈線性相關。

就總體而言,藍領工作者有著更低的受教育程度、收入和職業(yè)聲望;反之,專業(yè)工作者有著更高的受教育程度、收入和職業(yè)聲望。白領工作者介于兩者之間。

有趣的例外是,鐵路工程師(RR.engineer)的受教育程度較低,但收入較高,而牧師(minister)的職業(yè)聲望高,收入卻較低。

受教育程度和職業(yè)聲望(較輕微地)呈現(xiàn)雙峰分布,高值和低值數(shù)據多于中間的數(shù)據。

重要的是, R能夠讓你以一種簡單而直接的方式創(chuàng)建優(yōu)雅、信息豐富、高度定制化的圖形。而使用其他統(tǒng)計語言創(chuàng)建類似的圖形不僅費時費力,而且可能根本無法做到。

可惜的是, R語言學習曲線較為陡峭。因為它的功能非常豐富,所以文檔和幫助文件也相當多。另外,由于許多功能都是由獨立貢獻者編寫的可選模塊提供的,這些文檔可能比較零散而且很難找到。事實上,要掌握R的所有功能,可以說是一項挑戰(zhàn)。

<a href='/map/r/' style='color:#000;font-size:inherit;'>R語言</a>實戰(zhàn):<a href='/map/r/' style='color:#000;font-size:inherit;'>R語言</a>介紹


數(shù)據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調,回調的第一個參數(shù)驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }