99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀數(shù)據(jù)挖掘,機器學習,人工智能的簡單區(qū)別分析
數(shù)據(jù)挖掘,機器學習,人工智能的簡單區(qū)別分析
2018-07-02
收藏

數(shù)據(jù)挖掘,機器學習,人工智能的簡單區(qū)別分析

數(shù)據(jù)挖掘(data mining),機器學習(machine learning),和人工智能(AI)的區(qū)別是什么? 數(shù)據(jù)科學(data science)和商業(yè)分析(business analytics)之間有什么關系?

本來我以為不需要解釋這個問題的,到底數(shù)據(jù)挖掘(data mining),機器學習(machine learning),和人工智能(AI)有什么區(qū)別,但是前幾天因為有個學弟問我,我想了想發(fā)現(xiàn)我竟然也回答不出來,我在知乎和博客上查了查這個問題,發(fā)現(xiàn)還沒有人寫過比較詳細和有說服力的對比和解釋。那我根據(jù)以前讀的書和論文,還有和與導師之間的交流,嘗試著說一說這幾者的區(qū)別吧,畢竟一個好的定義在未來的學習和交流中能夠發(fā)揮很大的作用。同時補上數(shù)據(jù)科學和商業(yè)分析之間的關系。能力有限,如有疏漏,請包涵和指正。

導論

本文主要分為兩部分,第一部分闡述數(shù)據(jù)挖掘(data mining),機器學習(machine learning),和人工智能(AI)之間的區(qū)別。這三者的區(qū)別主要是目的不同,其手段(算法,模型)有很大的重疊,所以容易混淆。第二部分主要闡述以上的技能與數(shù)據(jù)科學(data science)的關系,以及數(shù)據(jù)科學(data science)和商業(yè)分析(business analytics)之間的關系。其實,數(shù)據(jù)科學家本身就是商業(yè)分析師在大數(shù)據(jù)時代的延伸。



數(shù)據(jù)挖掘VS. 機器學習VS. 人工智能

數(shù)據(jù)挖掘 (data mining): 有目的地從現(xiàn)有大數(shù)據(jù)中提取數(shù)據(jù)的模式(pattern)和模型(model)

數(shù)據(jù)挖掘是從現(xiàn)有的信息(existing information)中提取數(shù)據(jù)的模式(pattern)和模型(model),即精選出最重要的信息,以用于未來機器學習和AI的數(shù)據(jù)使用。其核心目的是找到數(shù)據(jù)變量之間的關系。其發(fā)展出來的主要原因是大數(shù)據(jù)的發(fā)展,用傳統(tǒng)的數(shù)據(jù)分析的方式已經(jīng)無能處理那么多大量的看似不相關的數(shù)據(jù)的處理,因此需要數(shù)據(jù)挖掘技術(shù)去提取各種數(shù)據(jù)和變量之間的相互關系,從而精煉數(shù)據(jù)。
數(shù)據(jù)挖掘本質(zhì)上像是機器學習和人工智能的基礎,他的主要目的是從各種各樣的數(shù)據(jù)來源中,提取出超集(superset)的信息,然后將這些信息合并讓你發(fā)現(xiàn)你從來沒有想到過的模式和內(nèi)在關系。這就意味著,數(shù)據(jù)挖掘不是一種用來證明假說的方法,而是用來構(gòu)建各種各樣的假說的方法。數(shù)據(jù)挖掘不能告訴你這些問題的答案,他只能告訴你,A和B可能存在相關關系,但是它無法告訴你A和B存在什么相關關系。

當然,數(shù)據(jù)挖掘會使用大量機器學習的算法,但是其特定的環(huán)境和目的和機器學習不太一樣。

機器學習(machine learning): 自動地從過往的經(jīng)驗中學習新的知識。

機器學習其實是人工智能很重要的一部分,因為目前,在實踐過程中,大多數(shù)的人工智能處理的任務,其實是用機器學習的方式完成的。機器學習可以用程序和算法自動地學習,只要被設計好了,這個程序可以進行自我優(yōu)化。同時,機器學習需要一定數(shù)量的訓練數(shù)據(jù)集(training data set),用于構(gòu)建來自過往經(jīng)驗的“知識” 。

機器學習目前在實踐中最重要的功能便是預測結(jié)果。比如機器學習已經(jīng)學習結(jié)束了,現(xiàn)在有一個新的數(shù)據(jù)集x,需要預測其分類,機器學習算法會根據(jù)這個新數(shù)據(jù)與學習后的“知識”相匹配(實際上,知識指的是學習后的數(shù)學模型),然后將這個數(shù)據(jù)集x分類某類C去。再比較常見的機器學習,比如amazon的推薦系統(tǒng)。

人工智能(AI): 一個廣泛的概念,本質(zhì)是用數(shù)據(jù)和模型去為現(xiàn)有的問題(existing problems)提供解決方法(solutions).

人工智能是一個與機器學習數(shù)據(jù)挖掘相對不同的概念,人工智能的目的是為了去創(chuàng)造有智力的電腦(不知道怎么翻譯好,可以假設其為機器人)。在實踐中,我們希望這個電腦可以像有智力的人一樣處理一個任務。因此,理論上人工智能幾乎包括了所有和機器能做的內(nèi)容,當然也包括了數(shù)據(jù)挖掘機器學習的內(nèi)容,同時還會有監(jiān)視(monitor)和控制進程(process control)的內(nèi)容。



數(shù)據(jù)科學(data science)和商業(yè)分析(business analytics)的關系?

其實以前,我們是沒有數(shù)據(jù)科學家(data scientist),和數(shù)據(jù)科學(data science)這個概念的。我們稱呼做相關內(nèi)容的方式更多叫商業(yè)分析(business analytics)。

在2011年的時候,麥肯錫發(fā)表了《Big Data: the next frontier for innovation, competition, and productivity》提出了現(xiàn)在很多的公司已經(jīng)開始往分析才能(analytical talent)中獲得競爭優(yōu)勢。雖然這不是第一篇提出這個概念的公司,但是是第一次提出,數(shù)據(jù)分析能力也有助于商業(yè)公司去發(fā)現(xiàn)潛在的機會,而不僅僅只對技術(shù)公司有效。接著麥肯錫認為到了2018年,美國大約會有190,000的項目缺少“深度分析能力(Deep Analytical Talent)”,而這些深度分析能力,是由大數(shù)據(jù)(big data)驅(qū)動的。至此,麥肯錫將”商業(yè)分析”進一步形容為”深度分析能力”。

接著DJ Patil和Jeff Hammerbacher在其寫的《Building Data Science Teams》,將麥肯錫的“深度分析能力”稱為了“數(shù)據(jù)科學家(data scientists)”。他們在文中提到:

商業(yè)分析師(business analyst)看起來太局限了,數(shù)據(jù)分析師(data anlyst)是他們的競爭者,但是我們還是覺得這個稱呼太局限了。....我們認為最好的稱呼應該是”數(shù)據(jù)科學家(data scientist)”,因為這些人需要同時使用數(shù)據(jù)(data)和科學(science)去創(chuàng)造一些新的東西。

緊接著,DJ Patil加了一些關鍵特點用于去尋找一個數(shù)據(jù)科學家(data scientist):
  1. 專業(yè)技術(shù)(Technical expertise): 最好的數(shù)據(jù)科學家需要有關于某些科學學科的深度專業(yè)知識(deep expertise)。
  2. 好奇心(Curiosity): 一個優(yōu)秀的數(shù)據(jù)科學家需要有挖掘潛在關系,解決問題和證明假說的強烈好奇心和渴望。
  3. 講故事的能力(Storytelling): 能用數(shù)據(jù)講一個生動的故事的能力,它能使交流更加有效。
  4. 聰明(Cleverness): 能夠創(chuàng)造性地解決問題的能力。
隨后,數(shù)據(jù)科學家這個概念才開始被廣為流傳。那么數(shù)據(jù)科學家需要具備哪些專業(yè)能力?不同的公司有不同的看法和意見(反正大家好像都喜歡把所有一切的期許都放在一個新興的行業(yè)中),這里列舉一個比較流行的看法:
1.Drew Conway’s Data Scientist Venn Diagram
2.Drew Tierney’s Multi-disciplinary Diagram
3.Gartner
最后附贈一張“作弊紙”,列出幾乎所有的商業(yè)問題(Business Problems),想要入門成為一個優(yōu)秀的商業(yè)分析師,或者是數(shù)據(jù)科學家,強烈推薦保存?。。。。。。。。。。。∫院笥袝r間,我會嘗試著逐一翻譯和解說一下。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }