99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀一個優(yōu)秀數據科學家的主要構成特點
一個優(yōu)秀數據科學家的主要構成特點
2016-03-29
收藏


根據三位作者的咨詢和研究經驗,以及與許多大數據和分析主題的公司合作,了解一個良好的數據科學家具有哪些主要特征。


大數據分析已經滿天都是,IBM項目,每天產生2.5兆字節(jié)的數據。這意味著90%的數據在過去的兩年里被創(chuàng)造出來。Gartnerprojects預測,到2015年,85%的500強的企業(yè)將無法利用大數據的競爭優(yōu)勢,并且大約有440萬個工作崗位將圍繞大數據創(chuàng)建起來。

雖然這些預測不能夠在絕對意義上進行解釋,但是他們代表無所不在的大數據,以及需要分析的能力和資源的強有力的指示。因為隨著數據堆積,管理和分析這些數據資源的最佳方式,已經成為創(chuàng)造競爭優(yōu)勢和戰(zhàn)略杠桿的關鍵成功因素。為了應對這些挑戰(zhàn),公司正在招聘數據科學家,然而在業(yè)內,對于什么是優(yōu)秀的數據科學家卻存在著很大的誤解和分歧。以下是一個優(yōu)秀的數據科學家的主要構成特點:




數據科學家應該是一個優(yōu)秀的程序員

根據定義,數據科學家與數據打交道。這涉及到大量的活動,如采樣和處理的數據,模型估計和后期處理(如敏感性分析,模型部署,回歸測試,模型驗證)。雖然在當今的市場上,很多用戶易于掌握的軟件工具是自動化的,但是每一個分析都需要用量身定制的步驟來解決特殊的業(yè)務問題。為了成功執(zhí)行這些步驟,就需要編程來解決了。



一個數據科學家應該有扎實的定量技能

一個數據科學家應該有統(tǒng)計,機器學習以及數據挖掘的背景。不同學科之間的區(qū)別越來越模糊,但是實際上并不是相關的。他們都提供了一套定量的技術來分析數據,并且在特定的背景下(如風險管理,欺詐檢測,營銷分析……),找到業(yè)務相關的模式。數據科學家應該知道哪些技術可以怎樣利用并知道應該何時應用。

他/她不應該把焦點放在基礎數學(例如優(yōu)化)的細節(jié)上,而是對分析問題的解決方法有一個很好的理解,以及如何解釋它的結果。這里,培訓一個計算機科學及商業(yè)/工業(yè)工程的工程師,目標應該是一個綜合的,多科學觀點,隨著最近這兩種技術的使用梯度形成的,以及能夠根據必要的商業(yè)觸覺帶來新的努力成果。




在這樣的背景下,同樣重要的是,花足夠多的時間來驗證分析結果,從而避免經常被提及到的數據信息及數據曲解,這些數據是(有意的)歪曲并且過于集中精力討論虛假的相關性,當選擇最佳的定量技術時,數據科學家應該考慮到業(yè)務問題的特殊性。

典型的分析模型的要求是:

行動能力(多大程度解決分析模型的業(yè)務問題?)

性能(分析模型的統(tǒng)計性能是什么?)

解釋能力(是否可以很容易地為決策者解決分析模型?)

運作效率(需要多少努力來建立,評估和監(jiān)測分析模型?)

法規(guī)遵從(是否符合規(guī)定的模型)以及經濟成本(簡歷,運行和維護的成本是什么?)。

根據這些要求的組合,數據科學家應該能夠選擇最佳的分析技術來解決業(yè)務問題。

一個數據科學家應該善于溝通與可視化的技能

不管你喜歡不喜歡,分析是一種技術性的鍛煉。在這個時候,分析模型和商業(yè)用戶之間有一個巨大的差距。為了彌補這個差距,溝通和定量技能的可視化設施是關鍵!

因此,數據科學家應該知道如何提出分析模型和他們的附隨統(tǒng)計以及易于用戶使用方式的報告。例如,交通燈的方法,聯(lián)機分析處理設施,”如果-然后”業(yè)務規(guī)則,……他/她應該能夠在不迷失復雜的細節(jié)(如統(tǒng)計)的情況下傳達適當的信息量,這些細節(jié)將會阻礙一個成功模型的部署。這樣做,企業(yè)用戶將會更好地了解他們的特點和在他們行為下的大數據,這將提高他們的態(tài)度并接受分析模型的結果。

教育機構必須學會平衡,因為它已經有很多的學術學位,以及因為過度分析或過度練習實踐知識的學生而知名了。



一個數據科學家應該有一個堅實的商業(yè)認識

了解業(yè)務是必須的。我們見證了許多數據科學項目失敗了,因為各自的分析師不理解手上的業(yè)務問題。通過”業(yè)務”,我們指的是,例如如果各自的數據被分析,那么在一個真實的商業(yè),或天文學,或醫(yī)學的環(huán)境下進行客戶流失預測或信用評分。

數據科學家應該是具有創(chuàng)造性的

一個具有創(chuàng)意的科學家至少需要兩個層次的創(chuàng)造力。首先,在技術層面上,在特征選擇,數據轉換和清洗數據方面具有創(chuàng)造性是非常重要的。標準知識發(fā)現(xiàn)過程的步驟必須適用于每一個特定的應用程序,通常”正確的猜測”可能會產生很大的差異。其次,大數據分析是一個快速發(fā)展的領域!新的問題,新的技術和相應的挑戰(zhàn)都出現(xiàn)在正在進行的基礎上。一個數據科學家需要不斷創(chuàng)新以適應這些新技術是非常重要的,并有足夠的創(chuàng)造力去了解他們如何創(chuàng)造新的商機。

結論:

我們提供了一個簡短的特點概述去尋找一個優(yōu)秀的科學家??傊?,由于大數據分析的多學科性質,數據科學家應該擁有一個混合的技能:編程,定量建模,溝通和可視化,業(yè)務理解能力以及創(chuàng)造力!下圖顯示了如何表達這些的文件。




圖:數據科學家簡介

原文作者 | Bart Baesens, Richard Weber, Cristián Bravo, 
翻譯 | 36大數據
http://www.36dsj.com/archives/44525

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數1:配置參數 // 參數2:回調,回調的第一個參數驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式,包括:float,popup width: "280px", https: true // 更多配置參數說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }