99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀Python、 R 語(yǔ)言、SAS、SPSS 優(yōu)缺點(diǎn)比較?
Python、 R 語(yǔ)言、SAS、SPSS 優(yōu)缺點(diǎn)比較?
2015-01-07
收藏

最近一直想入門數(shù)據(jù)分析的小伙伴問(wèn)我,如果要入事數(shù)據(jù)分析一直來(lái)說(shuō)要學(xué)那些語(yǔ)言呢?其實(shí)小編跟企業(yè)部門部門與侯選人接觸下來(lái),給我的感覺(jué)是對(duì)于這個(gè)初級(jí)的數(shù)據(jù)分析師來(lái),一般前二年做差不多都是老大讓你做的是處理臨時(shí)需求為主,如果小明給我做個(gè)報(bào)表,給市場(chǎng)部那邊拉一些流量情況,所以主要前兩年可能如果精通SQL與EXCEL再會(huì)點(diǎn)SPSS就差不多了,2年以后,老大會(huì)把一些:經(jīng)營(yíng)性分析需求與競(jìng)品分析給你,這里你可能你要需求統(tǒng)計(jì)軟件,3年以后會(huì)讓你做一些會(huì)員營(yíng)銷及其它的數(shù)據(jù)挖掘,這里一般說(shuō)來(lái)如果是互聯(lián)網(wǎng)行業(yè)可能R語(yǔ)言是最為流行。因?yàn)?a href='/map/r/' style='color:#000;font-size:inherit;'>R語(yǔ)言是開源的,所以互聯(lián)網(wǎng)企業(yè)很多在手還有一些通迅行業(yè)的咨詢公司,不過(guò)上手還是需要長(zhǎng)期的學(xué)習(xí);SPSS界面友好型,不過(guò)企業(yè)用正版也要很大一些數(shù),不過(guò)一般是市場(chǎng)研究用的比較多,如果你會(huì)用SPSS編程其實(shí)功能還是比較強(qiáng)大的,建議如果想先練手可以學(xué)這個(gè),上手快;SAS一般是金融企業(yè)特別是銀行業(yè)和醫(yī)學(xué)統(tǒng)計(jì),銀行業(yè)人員有一些是用SAS做統(tǒng)計(jì),一般是銀行業(yè)內(nèi)部人做的,另一種是給銀行業(yè)做數(shù)據(jù)挖掘的公司,不過(guò)正版一年也要上百萬(wàn),不是土豪也用不起,聽說(shuō)支付寶都不用,而是用R語(yǔ)言,而且SAS學(xué)習(xí)沒(méi)人指導(dǎo)很難學(xué);

所以看小伙伴的選擇,想在傳統(tǒng)或者咨詢公司做的SPSS比較合適,想去金融特別是銀行業(yè)SAS不錯(cuò),想進(jìn)互聯(lián)網(wǎng)公司學(xué)R語(yǔ)言可能是比較明智;



Twisted Python  觀點(diǎn):Python在你列舉這些里面是綜合功能最強(qiáng)大的,但是這些功能分散在第三方庫(kù)里面,沒(méi)有得到有機(jī)的整合,相應(yīng)的學(xué)習(xí)成本會(huì)較高。

Python與R不同,Python是一門多功能的語(yǔ)言。數(shù)據(jù)統(tǒng)計(jì)是更多是通過(guò)第三方包來(lái)實(shí)現(xiàn)的。

具體來(lái)說(shuō),我常用的Python在統(tǒng)計(jì)上面的Package有這樣一些

1.Numpy與Scipy。這兩個(gè)包是Python之所以能在數(shù)據(jù)分析占有一席之地的重要原因。其中Numpy封裝了基礎(chǔ)的矩陣和向量的操作,而Scipy則在Numpy的基礎(chǔ)上提供了更豐富的功能,比如各種統(tǒng)計(jì)常用的分布和算法都能迅速的在Scipy中找到。

2.Matplotlib。這個(gè)Package主要是用來(lái)提供數(shù)據(jù)可視化的,其功能強(qiáng)大,生成的圖標(biāo)可以達(dá)到印刷品質(zhì),在各種學(xué)術(shù)會(huì)議里面出鏡率不低。依托于Python,可定制性相對(duì)于其他的圖形庫(kù)更高。還有一個(gè)優(yōu)點(diǎn)是提供互動(dòng)化的數(shù)據(jù)分析,可以動(dòng)態(tài)的縮放圖表,用做adhoc analysis非常合適。

3.Scikit Learn。非常好用的Machine Learning庫(kù),適合于用于快速定制原型。封裝幾乎所有的經(jīng)典算法(神經(jīng)網(wǎng)絡(luò)可能是唯一的例外,不過(guò)這個(gè)有Pylearn2來(lái)補(bǔ)充),易用性極高。

4.Python標(biāo)準(zhǔn)庫(kù)。這里主要是體現(xiàn)了Python處理字符串的優(yōu)勢(shì),由于Python多功能的屬性和對(duì)于正則表達(dá)式的良好支持,用于處理text是在合適不過(guò)的了。

peng wang  觀點(diǎn):Python是一套比較平衡的語(yǔ)言,各方面都可以,而R是在統(tǒng)計(jì)方面比較突出,可在處理海量數(shù)據(jù)可能就比較難勝認(rèn)。

python與R相比速度要快。python可以直接處理上G的數(shù)據(jù);R不行,R分析數(shù)據(jù)時(shí)需要先通過(guò)數(shù)據(jù)庫(kù)把大數(shù)據(jù)轉(zhuǎn)化為小數(shù)據(jù)(通過(guò)groupby)才能交給R做分析,因此R不可能直接分析行為詳單,只能分析統(tǒng)計(jì)結(jié)果。Python=R+SQL/Hive

R的優(yōu)勢(shì)在于有包羅萬(wàn)象的統(tǒng)計(jì)函數(shù)可以調(diào)用,特別是在時(shí)間序列分析方面(主要用在金融分析與趨勢(shì)預(yù)測(cè))無(wú)論是經(jīng)典還是前沿的方法都有相應(yīng)的包直接使用;相比python在這方面貧乏不少。 

Python的優(yōu)勢(shì)在于其膠水語(yǔ)言的特性,一些底層用C寫的算法封裝在python包里后性能非常高效(Python的數(shù)據(jù)挖掘包Orange canve 中的決策樹分析50萬(wàn)用戶10秒出結(jié)果,用R幾個(gè)小時(shí)也出不來(lái),8G內(nèi)存全部占滿)。


數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }