99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線(xiàn)電話(huà):13121318867

登錄
首頁(yè)精彩閱讀沒(méi)有數(shù)據(jù)科學(xué)家大數(shù)據(jù)就玩不轉(zhuǎn)了
沒(méi)有數(shù)據(jù)科學(xué)家大數(shù)據(jù)就玩不轉(zhuǎn)了
2016-09-13
收藏

沒(méi)有數(shù)據(jù)科學(xué)家大數(shù)據(jù)就玩不轉(zhuǎn)了

數(shù)據(jù)科學(xué)家被媒體譽(yù)為21世紀(jì)最性感的職業(yè),是企業(yè)界身價(jià)不菲、一將難求的的超級(jí)明星,這嚇跑了很多準(zhǔn)備嘗試大數(shù)據(jù)的企業(yè),實(shí)際上沒(méi)有數(shù)據(jù)科學(xué)家企業(yè)一樣可以玩轉(zhuǎn)大數(shù)據(jù)。

如今, 一談到大數(shù)據(jù), 一個(gè)普遍的說(shuō)法就是人才的缺乏。 數(shù)據(jù)科學(xué)家成為了21世紀(jì)最性感的職業(yè)等等。 哈佛商業(yè)評(píng)論以及咨詢(xún)公司麥肯錫的報(bào)告都這么說(shuō), 再加上數(shù)據(jù)科學(xué)家們自身也樂(lè)意被打上這樣的標(biāo)簽。

然而, 這種說(shuō)法, 也讓很多準(zhǔn)備考慮大數(shù)據(jù)戰(zhàn)略的企業(yè)面對(duì)大數(shù)據(jù)的機(jī)會(huì)望而卻步了。 那么, 如果缺少數(shù)據(jù)科學(xué)家, 企業(yè)的大數(shù)據(jù)就真得玩兒不轉(zhuǎn)了嗎? 其實(shí)也未必。


這里, 當(dāng)然不是說(shuō)數(shù)據(jù)科學(xué)家不重要。 相反, 數(shù)據(jù)科學(xué)家這個(gè)職業(yè)在大數(shù)據(jù)時(shí)代非常重要。 在企業(yè)中, 數(shù)據(jù)科學(xué)家的工作, 實(shí)際上是聯(lián)系企業(yè)的IT技術(shù)和企業(yè)所在行業(yè)專(zhuān)業(yè)知識(shí)的紐帶。 這樣的知識(shí)交集上的人才, 本身確實(shí)匱乏, 而且, 即使大數(shù)據(jù)又再大的發(fā)展,同時(shí)具備這樣的知識(shí)的人才也還是少數(shù)。 然而, 就像我們?cè)谟?jì)算機(jī)行業(yè)發(fā)展的早期, 不能說(shuō)因?yàn)閱滩妓梗?蓋茨這樣的人才太少就制約了行業(yè)發(fā)展一樣。 如今, 街邊柯達(dá)店的小伙子都能用PS修人像, 而我們也不需要要求柯達(dá)店的小伙子具備編寫(xiě)圖像處理軟件能力。

大數(shù)據(jù)時(shí)代也是一樣, Google, Twitter, Facebook那樣的大公司, 可以負(fù)擔(dān)得起那些高精尖的數(shù)據(jù)科學(xué)家, 而小企業(yè), 也可以有自己的方式來(lái)更好地利用數(shù)據(jù)。 下面, 以電子商務(wù)的公司為例子, 結(jié)合數(shù)據(jù)科學(xué)家的工作, 來(lái)看看如何能夠在企業(yè)現(xiàn)有能力范圍內(nèi)進(jìn)行數(shù)據(jù)方面的工作。

數(shù)據(jù)科學(xué)家的工作, 大致分為三個(gè)方面:

第一, 數(shù)據(jù)架構(gòu)的搭建, 第二, 數(shù)據(jù)模型的建立, 第三, 數(shù)據(jù)分析。

下面我們來(lái)看看那些雇不起或找不著數(shù)據(jù)科學(xué)家的屌絲企業(yè)如何玩轉(zhuǎn)大數(shù)據(jù):

數(shù)據(jù)架構(gòu)的搭建:

首先, 確定企業(yè)對(duì)數(shù)據(jù)的需求點(diǎn)。 對(duì)絕大部分商業(yè)企業(yè)來(lái)說(shuō), 其實(shí)每個(gè)業(yè)務(wù)經(jīng)理都可以告訴你, 他們所需要的數(shù)據(jù)就是用戶(hù)行為的數(shù)據(jù), 比如, 用戶(hù)購(gòu)買(mǎi)行為, 用戶(hù)對(duì)促銷(xiāo)或者廣告的反應(yīng), 用戶(hù)的社交信息等等, 基本上, 每一類(lèi)這樣的信息, 都可以比較容易的進(jìn)行歸類(lèi)。

這里的關(guān)鍵, 就是盡量把需要的數(shù)據(jù)范圍進(jìn)行限定, 這樣就可以設(shè)定一些簡(jiǎn)單的數(shù)據(jù)輸入模板, 從而把數(shù)據(jù)采集和數(shù)據(jù)整理問(wèn)題簡(jiǎn)單化。 這里可以采用一些開(kāi)源工具, 如HadoopHbase, Hive, Pig等, 把各類(lèi)數(shù)據(jù)進(jìn)行整合。 2/8 原則一般是適用的, 也就是, 80%的進(jìn)行運(yùn)營(yíng)支撐的需求可以來(lái)自于20%的數(shù)據(jù)。 對(duì)企業(yè)來(lái)說(shuō), IT技術(shù)人員和業(yè)務(wù)專(zhuān)家共同的協(xié)作, 加上一部分外部咨詢(xún)的幫助, 應(yīng)該可以搭建一個(gè)可用的架構(gòu)。

數(shù)據(jù)模型的建立

數(shù)據(jù)科學(xué)家的另一部分工作就是數(shù)據(jù)模型的建立。 這些模型可能是描述型的模型, 也可能是預(yù)測(cè)性的模型。 這部分的工作, 也是數(shù)據(jù)科學(xué)家經(jīng)常被神化的部分。 其實(shí), 這部分工作, 比如說(shuō)推薦系統(tǒng), 用戶(hù)個(gè)性化系統(tǒng)等等。 數(shù)據(jù)科學(xué)家所做的大量工作, 在于提取數(shù)據(jù)的“特征”, 選擇合適的模型, 并把它們輸入模型, 等待模型輸出結(jié)果, 再驗(yàn)證, 調(diào)整特征的循環(huán)。 這部分的工作, 需要第一, 熟悉各類(lèi)統(tǒng)計(jì)模型或者機(jī)器學(xué)習(xí)模型的建立。 第二, 也是更重要的一點(diǎn), 就是行業(yè)知識(shí)的了解。 比如一個(gè)推薦系統(tǒng), 最重要的就是把提取用戶(hù)特征, 提取商品的特征。 如果建模的人對(duì)行業(yè)知識(shí)不了解的話(huà), 那么模型就會(huì)很龐大和復(fù)雜, 也未必精確。 在這里, 行業(yè)的專(zhuān)家, 盡管對(duì)建模未必很精通, 他們的市場(chǎng)感覺(jué)往往是選擇合適特征值的關(guān)鍵。

因此, 對(duì)電商企業(yè)來(lái)說(shuō), 招幾個(gè)學(xué)統(tǒng)計(jì)的員工(或者外包), 再配合企業(yè)內(nèi)部的行業(yè)專(zhuān)家, 也可以建一些適合企業(yè)需要的基本模型。 也許沒(méi)有Google或者Facebook那么地精確, 但是對(duì)絕大部分企業(yè)來(lái)說(shuō), 也夠用了。 這也不失為是一條在找不到合適的數(shù)據(jù)科學(xué)家(事實(shí)上精通本行業(yè)又精通建模的人才本來(lái)也是鳳毛麟角)的情況下的解決之道。

數(shù)據(jù)分析

數(shù)據(jù)分析的本質(zhì), 是把“數(shù)據(jù)”變成“信息”, 并從中發(fā)現(xiàn)對(duì)企業(yè)運(yùn)營(yíng)有價(jià)值的東西。 這其實(shí)和任何理科或者工科的“觀(guān)察 — 歸納 —關(guān)聯(lián) — 分析 —驗(yàn)證”的研究方法從本質(zhì)上是一致的。 從這個(gè)角度來(lái)講, 行業(yè)的專(zhuān)業(yè)知識(shí), 在數(shù)據(jù)分析的時(shí)候, 更加重要。

即使你把歐洲大型強(qiáng)子對(duì)撞機(jī)的數(shù)據(jù)給數(shù)據(jù)科學(xué)家, 他也發(fā)現(xiàn)不了“上帝粒子”。

國(guó)內(nèi)的很多人都會(huì)津津樂(lè)道 美國(guó)百貨公司Target通過(guò)數(shù)據(jù)分析給懷孕少女推送嬰兒產(chǎn)品的例子,而很多數(shù)據(jù)分析師或者數(shù)據(jù)科學(xué)家在提到這樣的例子的時(shí)候, 也在有意無(wú)意的進(jìn)行誤導(dǎo)。 其實(shí), 如果沒(méi)有對(duì)用戶(hù)和產(chǎn)品方面的專(zhuān)業(yè)知識(shí), 光靠數(shù)據(jù)分析或者數(shù)據(jù)模型, 是很難做到的。 而事實(shí)上, 任何機(jī)器生成的模型, 要想實(shí)用的話(huà), 也都得需要人工在反饋路徑上進(jìn)行一定程度上的調(diào)整。

在數(shù)據(jù)分析領(lǐng)域, 已經(jīng)有很多的分析工具。 然而, 現(xiàn)在的這些工具, 大多數(shù)也還是比較復(fù)雜。 需要類(lèi)似數(shù)據(jù)科學(xué)家或者數(shù)據(jù)分析師這樣的專(zhuān)門(mén)人員來(lái)使用。 由于企業(yè)精細(xì)化運(yùn)營(yíng)的程度普遍不高。 數(shù)據(jù)分析師或者是BI的分析師本來(lái)就稀缺, 更不要說(shuō)精通行業(yè)專(zhuān)業(yè)領(lǐng)域知識(shí)同時(shí)具備數(shù)據(jù)分析工具使用能力的人才了。 一個(gè)解決的方式, 就是把常用的分析盡量模板化, 數(shù)據(jù)的整理盡量簡(jiǎn)化。 盡量采用Excel這樣簡(jiǎn)單大眾的分析工具。 歸根結(jié)底, 企業(yè)進(jìn)行數(shù)據(jù)分析的目的, 是為了經(jīng)營(yíng)服務(wù)的。 簡(jiǎn)單的工具, 在使用,分享和溝通方面都有優(yōu)勢(shì)。 這樣的解決方案當(dāng)然不算得完美, 但是, 如果能讓具備豐富行業(yè)經(jīng)驗(yàn)的專(zhuān)家以行業(yè)經(jīng)驗(yàn)來(lái)彌補(bǔ)數(shù)據(jù)分析工具的不足, 對(duì)企業(yè)來(lái)說(shuō), 也算得上是一個(gè)在缺乏數(shù)據(jù)科學(xué)家情況下的可以從數(shù)據(jù)分析中獲益的方式。

在大數(shù)據(jù)時(shí)代, 數(shù)據(jù)科學(xué)家的重要性當(dāng)然是毋庸置疑的。 不過(guò), 就像網(wǎng)站內(nèi)容管理系統(tǒng)那樣, 大型網(wǎng)站可以雇頂級(jí)工程師來(lái)自建系統(tǒng)。 小企業(yè)也可以利用WordPress這樣的系統(tǒng)來(lái)滿(mǎn)足自身的需求一樣。

企業(yè)在這個(gè)人才匱乏的大數(shù)據(jù)時(shí)代, 利用已有的工具, 結(jié)合自身對(duì)行業(yè)的專(zhuān)業(yè)知識(shí), 采取合適的策略, 同樣也可以從數(shù)據(jù)和數(shù)據(jù)分析中獲益。


數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線(xiàn)
立即咨詢(xún)
客服在線(xiàn)
立即咨詢(xún)
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶(hù)后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }