99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀Google首席決策師告訴你數(shù)據(jù)科學(xué)究竟是什么
Google首席決策師告訴你數(shù)據(jù)科學(xué)究竟是什么
2018-09-10
收藏


關(guān)于作者:
Cassie Kozyrkov,Google首席決策師。致力于統(tǒng)計(jì)學(xué), 機(jī)器學(xué)習(xí) /人工智能、數(shù)據(jù)、決策科學(xué)。

數(shù)據(jù)科學(xué)是讓數(shù)據(jù)變得有用的學(xué)科。在本文中我將對(duì)數(shù)據(jù)科學(xué)中以下三個(gè)概念進(jìn)行解讀:

統(tǒng)計(jì)

機(jī)器學(xué)習(xí)

數(shù)據(jù)挖掘/分析

1. 定義數(shù)據(jù)科學(xué)

看到數(shù)據(jù)科學(xué)這個(gè)術(shù)語的早期歷史,你會(huì)發(fā)現(xiàn)當(dāng)時(shí)有兩個(gè)概念是密不可分的。


  • 大數(shù)據(jù)意味著要更多地利用計(jì)算機(jī)

  • 統(tǒng)計(jì)學(xué)很難把紙上的算法通過計(jì)算機(jī)實(shí)現(xiàn)


因此,數(shù)據(jù)科學(xué)誕生了。最開始數(shù)據(jù)科學(xué)家的的定義是“能夠編程的統(tǒng)計(jì)學(xué)家”。如今看來,這個(gè)說法并不準(zhǔn)確,但首先讓我們看到數(shù)據(jù)科學(xué)本身。

2003年的數(shù)據(jù)科學(xué)期刊中曾提出:“‘?dāng)?shù)據(jù)科學(xué)’意味著任何與數(shù)據(jù)有關(guān)的內(nèi)容”。我很同意這個(gè)觀點(diǎn),現(xiàn)在一切都離不開數(shù)據(jù)。

之后,我們看到了很多不同的觀點(diǎn),比如Conway的維恩圖(下圖),以及Mason和Wiggins的經(jīng)典觀點(diǎn)。

Drew Conway對(duì)數(shù)據(jù)科學(xué)的定義

我個(gè)人更喜歡維基百科上的定義:

數(shù)據(jù)科學(xué)是“結(jié)合了統(tǒng)計(jì)、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)及其相關(guān)方法的概念”,以便用數(shù)據(jù)“理解和分析實(shí)際現(xiàn)象”。

這有些復(fù)雜了,讓我們精簡(jiǎn)一下,即:

“數(shù)據(jù)科學(xué)是讓數(shù)據(jù)有用的學(xué)科?!?

你現(xiàn)在可能會(huì)想,但這也太精簡(jiǎn)了,“有用”這個(gè)詞怎么能囊括所有這些術(shù)語呢?

那么讓我們先看到下面的圖。

統(tǒng)計(jì)學(xué)家和機(jī)器學(xué)習(xí)工程師之間的區(qū)別,并不是前者使用R語言而后者使用Python。由于許多原因,用SQL、R、Python進(jìn)行分類是不明智的,如今你甚至可以用SQL進(jìn)行機(jī)器學(xué)習(xí)。

新手還喜歡通過算法進(jìn)行區(qū)分,許多大學(xué)課程也是這么安排的,這也是不明智的。最好不要用直方圖、t檢驗(yàn)以及神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。坦率地說,如果你很聰明,其實(shí)你可以用相同的算法解決任何數(shù)據(jù)科學(xué)問題。

我建議可以這樣進(jìn)行區(qū)分:

這指的是什么呢?當(dāng)然是決定。你可以根據(jù)所需的事實(shí),通過描述性分析得出決策。

我們的行動(dòng)和決定會(huì)影響周圍的世界。我們之前談到要讓數(shù)據(jù)變得有用,而這與現(xiàn)實(shí)世界的行動(dòng)是緊密相關(guān)的。

以下是決策導(dǎo)向圖,完成這三點(diǎn)能夠讓數(shù)據(jù)變得有用。

2. 數(shù)據(jù)挖掘

如果你不知道想做出什么樣的決定,那么最好的做法就是去尋找靈感。這就稱為數(shù)據(jù)挖掘、數(shù)據(jù)分析、描述性分析、探索性數(shù)據(jù)分析或(EDA)或知識(shí)發(fā)現(xiàn)(KD)。

分析的黃金法則:只對(duì)你所看到的做出結(jié)論。

你可以將數(shù)據(jù)集想象為在暗室中發(fā)現(xiàn)的一堆底片。數(shù)據(jù)挖掘就是讓設(shè)備盡快曝光這些照片,看是否能從中得出啟發(fā)。數(shù)據(jù)挖掘的黃金法則是:只能對(duì)你能看到的做出結(jié)論,不要對(duì)你看不到的內(nèi)容做出判斷,因?yàn)槟阈枰y(tǒng)計(jì)數(shù)據(jù)等更多的專業(yè)知識(shí)。

數(shù)據(jù)挖掘的專業(yè)知識(shí)取決于檢查數(shù)據(jù)的速度。一開始暗房會(huì)令人生畏,但其實(shí)也沒什么大不了的,只是學(xué)會(huì)使用設(shè)備就行了。當(dāng)你開始樂在其中時(shí),你就可以稱為數(shù)據(jù)分析師了;當(dāng)你能夠飛速地曝光照片時(shí),你就可以稱為分析師專家了。

3. 統(tǒng)計(jì)推斷

靈感很容易獲得,但嚴(yán)謹(jǐn)來之不易。如果你想重復(fù)利用數(shù)據(jù),那么則需要專業(yè)的培訓(xùn)。作為本科和碩士都學(xué)統(tǒng)計(jì)學(xué)專業(yè)的人,我認(rèn)為統(tǒng)計(jì)推斷(簡(jiǎn)稱統(tǒng)計(jì))是三個(gè)領(lǐng)域中最難且最具哲學(xué)內(nèi)涵的。想學(xué)好統(tǒng)計(jì)需要花費(fèi)大量時(shí)間。

如果你打算做出高質(zhì)量、風(fēng)險(xiǎn)可控的重要決策,那么你需要在分析團(tuán)隊(duì)中加入統(tǒng)計(jì)技能。在不確定的情況下,統(tǒng)計(jì)學(xué)是能改變你想法的學(xué)科。

4. 機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)實(shí)質(zhì)上是使用例子而不是指令來實(shí)現(xiàn)操作。關(guān)于機(jī)器學(xué)習(xí)我曾寫過一些文章,如關(guān)于機(jī)器學(xué)習(xí)與AI 的區(qū)別;如何入門機(jī)器學(xué)習(xí)等,如果感興趣的話可以看看。


  • The simplest explanation of machine learning you’ll ever read
    https://hackernoon.com/the-simplest-explanation-of-machine-learning-youll-ever-read-bebc0700047c

  • Are you using the term 'AI' incorrectly?
    https://medium.com/@kozyrkov/are-you-using-the-term-ai-incorrectly-911ac23ab4f5

  • Why businesses fail at machine learning
    https://hackernoon.com/why-businesses-fail-at-machine-learning-fbff41c4d5db


5. 數(shù)據(jù)工程

那么數(shù)據(jù)工程是什么呢?數(shù)據(jù)工程指的是為數(shù)據(jù)科學(xué)團(tuán)隊(duì)提供數(shù)據(jù)的工作。數(shù)據(jù)工程本身就是一個(gè)復(fù)雜的領(lǐng)域,它更接近軟件工程,而不是統(tǒng)計(jì)學(xué)。

數(shù)據(jù)工程和數(shù)據(jù)科學(xué)之間的差異是前后的區(qū)別。獲取數(shù)據(jù)前的大部分技術(shù)工作都可以簡(jiǎn)單地稱為“數(shù)據(jù)工程”,而得到數(shù)據(jù)后我們所做的一切都是“數(shù)據(jù)科學(xué)”。

6. 決策智能

決策智能是關(guān)于決策的,包括對(duì)根據(jù)大量數(shù)據(jù)進(jìn)行決策,因此這也使其成為一個(gè)工程學(xué)科。它利用社會(huì)和管理科學(xué)的理念,增強(qiáng)數(shù)據(jù)科學(xué)的應(yīng)用。

決策智能是社會(huì)和管理科學(xué)的組成部分。換而言之,它是數(shù)據(jù)科學(xué)的超集,而不涉及為通用用途創(chuàng)建基本方法之類的研究工作。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }