99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線(xiàn)電話(huà):13121318867

登錄
首頁(yè)精彩閱讀數(shù)據(jù)科學(xué)家大調(diào)查:職業(yè)受挫數(shù)據(jù)多樣性,吐槽Hadoop
數(shù)據(jù)科學(xué)家大調(diào)查:職業(yè)受挫數(shù)據(jù)多樣性,吐槽Hadoop
2015-01-04
收藏

數(shù)據(jù)科學(xué)家大調(diào)查:職業(yè)受挫數(shù)據(jù)多樣性,吐槽Hadoop


經(jīng)過(guò)無(wú)數(shù)權(quán)威媒體的反復(fù)轟炸,我們大致已經(jīng)相信,數(shù)據(jù)科學(xué)家是21世紀(jì)最神秘最性感最多金的職業(yè),他們是大數(shù)據(jù)時(shí)代數(shù)據(jù)炸彈的拆彈專(zhuān)家,企業(yè)數(shù)字化經(jīng)營(yíng)的發(fā)動(dòng)機(jī),他們的身價(jià)堪比NFL四分衛(wèi),而且,他們比昆侖山上的雪豹數(shù)量還少。

顯然,數(shù)據(jù)科學(xué)家個(gè)個(gè)都是十八般數(shù)據(jù)分析武藝樣樣精通的絕世高手,但他們近來(lái)也有煩心事。不久前,開(kāi)源數(shù)據(jù)庫(kù)SciDB開(kāi)發(fā)商Paradigm4進(jìn)行的一項(xiàng)針對(duì)111名北美數(shù)據(jù)科學(xué)家的調(diào)查顯示,71%的數(shù)據(jù)科學(xué)家認(rèn)為數(shù)據(jù)來(lái)源的多樣性(IT經(jīng)理網(wǎng)記者此前曾與百度創(chuàng)始七劍客之一,酷我音樂(lè)CEO雷鳴討論機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析的最大挑戰(zhàn),他也認(rèn)為是數(shù)據(jù)維度),而不是數(shù)據(jù)總量構(gòu)成其職業(yè)最大威脅和挑戰(zhàn)。

值得注意的是,只有48%的受訪(fǎng)數(shù)據(jù)科學(xué)家表示他們?cè)诠ぷ髦性褂眠^(guò)Hadoop或者Spark,高達(dá)76%的數(shù)據(jù)科學(xué)家抱怨Hadoop太慢,編程速度過(guò)慢,以及其他一些局限性。

雖然Hadoop口碑不佳,但是有接近半數(shù)的數(shù)據(jù)科學(xué)家表示很難將數(shù)據(jù)存入傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)表中。Nexedi的首席執(zhí)行官Jean-Paul Smets在接受采訪(fǎng)時(shí)也曾指出,大數(shù)據(jù)的真正難題其實(shí)并不是所謂的“大”,業(yè)界目前缺乏是通過(guò)使用高效的分布式運(yùn)算法則來(lái)處理數(shù)據(jù)的軟件,Hadoop過(guò)于依賴(lài)Java,而Java已經(jīng)被Oracle牢牢控制。中國(guó)興起的去IOE運(yùn)動(dòng),實(shí)際上為Hadoop之外的大數(shù)據(jù)軟件方案提供了良機(jī)。

企業(yè)大數(shù)據(jù)進(jìn)入復(fù)雜分析階段

根據(jù)報(bào)告,有59%的數(shù)據(jù)科學(xué)家表示其所在企業(yè)已經(jīng)開(kāi)始采用更加復(fù)雜的分析技術(shù),例如集群、機(jī)器學(xué)習(xí)、種量分析(Principal components analysis)、圖論分析等高級(jí)分析技術(shù)分析數(shù)據(jù),而不是局限于傳統(tǒng)的BI報(bào)告。

還有15%的數(shù)據(jù)科學(xué)家表示計(jì)劃在明年啟用復(fù)雜分析技術(shù),另有16%的數(shù)據(jù)科學(xué)家表示將在未來(lái)兩年內(nèi)采用復(fù)雜分析技術(shù)。

Hadoop被過(guò)度吹捧

Paradigm4的報(bào)告指出,Hadoop被過(guò)度吹捧成無(wú)所不能的,革命性的大數(shù)據(jù)解決方案,實(shí)際上Hadoop并不適用于需要進(jìn)行復(fù)雜分析的大數(shù)據(jù)應(yīng)用場(chǎng)景。

Hadoop的核心技術(shù)方法數(shù)據(jù)并行(data parallel),被Paradigm4稱(chēng)作“鬧心的并行”。報(bào)告指出,復(fù)雜分析人物往往需要經(jīng)常訪(fǎng)問(wèn)、處理和分享全體數(shù)據(jù),并在數(shù)據(jù)處理中交叉溝通中間結(jié)果,而這恰恰是Hadoop MapReduce的軟肋。

22%的受調(diào)查數(shù)據(jù)科學(xué)家表示Hadoop和Spark壓根不適合他們的分析任務(wù),此外還有35%的數(shù)據(jù)科學(xué)家在嘗試Hadoop或Spark后停止使用這兩項(xiàng)技術(shù)。

總結(jié):

在快數(shù)據(jù)和機(jī)器學(xué)習(xí)為主要趨勢(shì)的大數(shù)據(jù)潮流中,Hadoop作為開(kāi)源系統(tǒng),企業(yè)用戶(hù)自主安裝后,其性能優(yōu)化有相當(dāng)技術(shù)門(mén)檻。其實(shí)Hadoop系統(tǒng)也并非數(shù)據(jù)科學(xué)家反映得那樣不堪用,Hadoop系統(tǒng)其實(shí)也可以快起來(lái),例如老牌超算廠(chǎng)商Cray的Hadoop解決方案進(jìn)行了軟硬件調(diào)優(yōu),并且提供后繼的技術(shù)支持,測(cè)試性能要高出很多倍,很好地解決了Hadoop性能差的問(wèn)題。

Paradigm4數(shù)據(jù)科學(xué)家調(diào)查報(bào)告中的一些亮點(diǎn)被濃縮在下面這張信息圖中,供有興趣的讀者深究:paradigm4-data-scientist-survey-infographic-100354377-large.idge

數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線(xiàn)
立即咨詢(xún)
客服在線(xiàn)
立即咨詢(xún)
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶(hù)后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }