99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀10個(gè)表明數(shù)據(jù)科學(xué)能力成熟的跡象
10個(gè)表明數(shù)據(jù)科學(xué)能力成熟的跡象
2016-04-01
收藏

10個(gè)表明數(shù)據(jù)科學(xué)能力成熟的跡象

通常情況下,我們的業(yè)務(wù)已經(jīng)轉(zhuǎn)向?yàn)榫毩?xí)組織運(yùn)作方式的轉(zhuǎn)型——“建設(shè)一種能力”意味著建設(shè)一種文化來支持和充分利用數(shù)據(jù)科學(xué)。在許多情況下,這種文化的改變能夠?yàn)槭澜缟系脑S多挑戰(zhàn)性難題提供方向——貧困、疾病爆發(fā)、海洋健康等等。我們已經(jīng)遇到了許多成功組織結(jié)構(gòu)、技術(shù)水平、科學(xué)技能和算法模式。

基于這些經(jīng)驗(yàn),我們在這里分享我們的觀點(diǎn)

如何評估您正在建設(shè)的數(shù)據(jù)科學(xué)能力是否已經(jīng)成熟。這里是我們總結(jié)的一個(gè)成熟的數(shù)據(jù)科學(xué)能力所具備的特點(diǎn)TOP10,以下排名不分先后。

一個(gè)成熟的數(shù)據(jù)科學(xué)組織會(huì)……

1.……將所有數(shù)據(jù)和數(shù)據(jù)訪問公開化

讓我們從弄清楚一件事開始:Silos suck!大多數(shù)在數(shù)據(jù)科學(xué)學(xué)習(xí)曲線上的早期組織會(huì)耗費(fèi)大量時(shí)間收集數(shù)據(jù)而不去分析數(shù)據(jù)。而成熟的數(shù)據(jù)科學(xué)組織認(rèn)識(shí)到,為了成功,他們必須使他們的成員能夠訪問和使用所有可用的數(shù)據(jù)——不是一部分?jǐn)?shù)據(jù)、不是數(shù)據(jù)的一個(gè)子集、不是一個(gè)例子,而是所有的數(shù)據(jù)。律師不會(huì)只帶著部分支持他們的證據(jù)出庭,他們會(huì)帶上全部支持證據(jù)。同樣,成熟的數(shù)據(jù)科學(xué)組織使用他們所有的數(shù)據(jù)來了解他們的業(yè)務(wù)范圍,需求和性能。成功的組織會(huì)花時(shí)間去了解他們收集的所有資料,了解其用途和內(nèi)容,并允許其被方便地訪問。

最近的一些文章指出大數(shù)據(jù)和數(shù)據(jù)科學(xué)是相互排斥的:專注增加數(shù)據(jù)收集(大數(shù)據(jù))犧牲了質(zhì)量分析(數(shù)據(jù)科學(xué))。我們不這么認(rèn)為。它們在數(shù)據(jù)驅(qū)動(dòng)的決策上相互促進(jìn),并能在分析方法的創(chuàng)新上獲得巨大回報(bào)。

大數(shù)據(jù)并不是數(shù)據(jù)量,而是“全部數(shù)據(jù)”——用新奇有趣的方式連接不同數(shù)據(jù)源,以促進(jìn)數(shù)據(jù)科學(xué)的探索,以及用于強(qiáng)大的預(yù)測和規(guī)則分析的所有數(shù)據(jù)資源的探索。

成熟的數(shù)據(jù)科學(xué)離不開公開所有數(shù)據(jù)的訪問權(quán)限。包括規(guī)范元數(shù)據(jù)、訪問協(xié)議和發(fā)現(xiàn)機(jī)制。直到你公開所有的數(shù)據(jù),你的組織才會(huì)成熟。

組織的文化因素很重要。我們也看到過許多組織仍然使用把數(shù)據(jù)權(quán)限當(dāng)成攔路虎:我們聽說我們無法獲得數(shù)據(jù),因?yàn)閿?shù)據(jù)管理者會(huì)使我們的訪問會(huì)受到限制。管理是必要的,但它不能是一個(gè)人或團(tuán)體控制數(shù)據(jù)訪問的借口。放手吧,讓數(shù)據(jù)探索和創(chuàng)新搞起來!

2.……全面使用Agile并利用dataops

(即,DevOps的數(shù)據(jù)產(chǎn)品開發(fā))。

一些傳統(tǒng)組織陷在舊的管理流程和發(fā)展方式中。如果您的IT和發(fā)展部門提需求需要花一年或更多的時(shí)間,你可能會(huì)體驗(yàn)到這種感受。這些組織拒絕改變——因此,對新工具的需求要經(jīng)過評審委員會(huì)的評審和無休止的架構(gòu)/設(shè)計(jì)部門的支出核算。通常,很多精力耗費(fèi)在只是研究建議解決方案的可行性上了。其他時(shí)間,一個(gè)委員會(huì)將決定哪些是最為緊迫的問題。為了實(shí)現(xiàn)數(shù)據(jù)科學(xué)的成熟與成功,這種冗長的流程必須被打破。官僚主義在科學(xué)界無用,在數(shù)據(jù)科學(xué)方面也沒有用處。科學(xué)界感謝探索,Agile,快速失敗的實(shí)驗(yàn)設(shè)計(jì)(見“7.…感謝快速失敗的合作文化”)。

就像Agile開發(fā)深諳用戶故事,縮短了冗長的反復(fù)提需求和延遲的流程,Agile數(shù)據(jù)科學(xué)既需要與企業(yè)密切合作,也需要實(shí)驗(yàn)的自由。Agile不是一種軟件開發(fā)的方法論,而是一種思維傾向。它滲透到所有成熟水平的組織。上次你的CEO或高管舉辦回顧或Scrum會(huì)議是什么時(shí)候?理解如何推動(dòng)一個(gè)靈活的文化和組織、技術(shù)共同運(yùn)行可能具有挑戰(zhàn)性,但因其合作方式和培養(yǎng)出的創(chuàng)造力,它是非常有益的。

有一種Agile DevOps的數(shù)據(jù)產(chǎn)品開發(fā)方法是至關(guān)重要的-我們稱之為dataops。Dataops與DevOps原則相同:產(chǎn)品開發(fā)人員和最終用戶之間的緊密合作業(yè)務(wù);簡明清晰的需求收集和分析周期;較短的迭代周期產(chǎn)品發(fā)布(包括成功和快速失敗的機(jī)會(huì));更快的上市時(shí)間;更好的定義你的MVP(最小可行產(chǎn)品)以更低的產(chǎn)品失敗率取得快速成功;創(chuàng)建一個(gè)動(dòng)態(tài)的、有參與感的團(tuán)隊(duì)氛圍。除了這些一般的Agile的特點(diǎn),dataops還具備加速現(xiàn)時(shí)數(shù)據(jù)分析能力,隨之開拓了新的快速數(shù)據(jù)結(jié)構(gòu)(如讀取數(shù)據(jù)湖架構(gòu)),使以前不可能的分析變成可能。dataops將精確的重點(diǎn)放在每一個(gè)MVP和相應(yīng)的SCRUM sprints,最大限度地減少團(tuán)隊(duì)因漫長的審查周期和不同項(xiàng)目間的認(rèn)知轉(zhuǎn)換成本而造成的停頓時(shí)間。

成熟的數(shù)據(jù)科學(xué)能力滿足一個(gè)Agile dataops環(huán)境的全部條件。

3.……利用數(shù)據(jù)狂人與企業(yè)合作(即數(shù)據(jù)冠軍、編程馬拉松等)

生活在一個(gè)圈子中的數(shù)據(jù)科學(xué)團(tuán)體會(huì)錯(cuò)過圈子外最好的社區(qū)。能造成良好社會(huì)效應(yīng)的數(shù)據(jù)科學(xué)活動(dòng),包括公開的或內(nèi)部的競賽(如Kaggle),是提煉技能、學(xué)習(xí)新知識(shí)或與其他部門的業(yè)務(wù)合作的一個(gè)好方式。

此外,成熟的數(shù)據(jù)科學(xué)團(tuán)體不會(huì)自己單獨(dú)進(jìn)行嘗試,而是與組織的其他部門一同協(xié)作。成功策略之一是鼓勵(lì)內(nèi)部科學(xué)競賽,這有利于團(tuán)隊(duì)建設(shè)和整合。成熟的數(shù)據(jù)科學(xué)組織有一種合作文化,數(shù)據(jù)科學(xué)團(tuán)隊(duì)會(huì)與企業(yè)合作,使用數(shù)據(jù)解決關(guān)鍵問題。

另一種方法是內(nèi)部眾包(組織內(nèi))-這對于將最好的問題平面化供數(shù)據(jù)科學(xué)家解決尤為有效。成熟的數(shù)據(jù)科學(xué)能力內(nèi)部眾包了數(shù)據(jù)科學(xué)處理流程里的多個(gè)不同的任務(wù),包括數(shù)據(jù)選擇、數(shù)據(jù)清理、數(shù)據(jù)準(zhǔn)備與轉(zhuǎn)換;集合模型生成;模型評價(jià);和假設(shè)精煉化(見“4.……遵循嚴(yán)格的科學(xué)方法,,即測量、實(shí)驗(yàn)、紀(jì)律化、迭代、精煉所需的假設(shè)”)。由于數(shù)據(jù)清理和準(zhǔn)備會(huì)消耗整個(gè)項(xiàng)目50-80%的經(jīng)歷,你可以通過并行化(通過眾包)這些清理和準(zhǔn)備工作,特別是通過眾包,分配給組織里最熟悉特定的數(shù)據(jù)產(chǎn)品和數(shù)據(jù)庫的人,顯著節(jié)省了項(xiàng)目時(shí)間,并減少了風(fēng)險(xiǎn)。

此外,算法不能解決所有問題。讓算法了解所有可能的情況下的結(jié)果并選擇正確的結(jié)果仍然是極為困難的。人類仍然在不斷追尋著,人們深知挑戰(zhàn)的背景是對數(shù)據(jù)的實(shí)體解釋并建立精確的模型。

4.……遵循嚴(yán)格的科學(xué)方法,即測量、實(shí)驗(yàn)、紀(jì)律化、迭代、精煉所需的假設(shè)

求知心和無紀(jì)律是不相容的。這并不意味著約束、限制想象力或官僚化。一些組織會(huì)雇用一些數(shù)據(jù)科學(xué)家將他們安排在小房間里,并期待即時(shí)結(jié)果。另一種情況則是,數(shù)據(jù)科學(xué)家在IT組織里負(fù)責(zé)操作,而不是發(fā)現(xiàn)和創(chuàng)新。

成熟的數(shù)據(jù)科學(xué)能力建立在科學(xué)方法的基礎(chǔ)之上。首先,進(jìn)行觀察(即,收集對您的業(yè)務(wù)產(chǎn)生影響的對象、事件和過程的數(shù)據(jù))——收集數(shù)據(jù),以便在您的業(yè)務(wù)流程中的適當(dāng)?shù)牡胤角度霚y量系統(tǒng)或流程(或人員)來了解您的業(yè)務(wù)。思考有趣的問題,探索,然后與您的業(yè)務(wù)伙伴制定可供實(shí)驗(yàn)的假設(shè)。當(dāng)你有了一套好的問題和假設(shè),然后測試他們的分析數(shù)據(jù),制定一個(gè)科學(xué)的數(shù)據(jù)模型,或者設(shè)計(jì)一個(gè)新的算法來驗(yàn)證每一個(gè)假設(shè),或者細(xì)化的假設(shè)和迭代。這種方法將確保值是設(shè)定在正式科學(xué)嚴(yán)謹(jǐn)?shù)膽?yīng)用之上。這是一個(gè)成熟的數(shù)據(jù)科學(xué)能力無需置疑的特點(diǎn)。

科學(xué)流程的關(guān)鍵部分之一是了解你樣本的局限性。尋找和測試選擇偏差是關(guān)鍵。同樣重要的是要理解“大數(shù)據(jù)”并不意味著結(jié)束不完整的樣本(不公平抽樣)或樣本方差(自然多樣性)。

5.……吸引和雇用各種參與者,給予他們探索的自由

關(guān)鍵詞:各種。一大堆數(shù)學(xué)書呆子有什么好玩的?(三個(gè)統(tǒng)計(jì)人員一起外出打獵。過了一會(huì)兒,他們發(fā)現(xiàn)一只兔子。第一個(gè)統(tǒng)計(jì)學(xué)家在一米范圍內(nèi)瞄準(zhǔn)并射偏了兔子。第二個(gè)在一米內(nèi)內(nèi)瞄準(zhǔn)但沒有射中兔子。第三個(gè)人大叫“我們打中了!”)一些組織正在尋找偉大的程序員的數(shù)據(jù)科學(xué)家,他們也理解和運(yùn)用復(fù)雜的應(yīng)用數(shù)學(xué),知道很多關(guān)于具體的業(yè)務(wù)領(lǐng)域,能與所有利益相關(guān)者的溝通。或許會(huì)有一到兩個(gè)這樣的人存在,我們稱之為紫色的獨(dú)角獸。成熟的組織將數(shù)據(jù)科學(xué)視為一項(xiàng)團(tuán)隊(duì)運(yùn)動(dòng),每個(gè)成員都會(huì)貢獻(xiàn)寶貴的獨(dú)特技能和觀點(diǎn)。


他們的技能和能力如下:先進(jìn)的數(shù)據(jù)庫/數(shù)據(jù)管理和數(shù)據(jù)結(jié)構(gòu),智能元數(shù)據(jù)索引,搜索,檢索,數(shù)據(jù)挖掘機(jī)器學(xué)習(xí))和分析(KDD=數(shù)據(jù)知識(shí)探索);統(tǒng)計(jì)和統(tǒng)計(jì)程序設(shè)計(jì);數(shù)據(jù)與信息可視化;挖掘網(wǎng)絡(luò)分析圖(一切都是圖!);語義(自然語言處理、本體);數(shù)據(jù)密集型計(jì)算(如Hadoop,Spark,云,等);建模與仿真(計(jì)算機(jī)數(shù)據(jù)科學(xué));和特定領(lǐng)域的數(shù)據(jù)分析工具。

但不要以為每個(gè)人都一開始就要有這些技能中的至少一個(gè)——一些最好的數(shù)據(jù)科學(xué)組織,通過提煉目前員工中能夠促成數(shù)據(jù)科學(xué)成功的核心能力,培養(yǎng)這些技能(即使在非技術(shù)培訓(xùn)的員工范圍內(nèi))。這些核心能力包括10個(gè)C:好奇(好奇)、創(chuàng)新(創(chuàng)新),溝通,協(xié)作,勇敢的解決問題,致力于終身學(xué)習(xí)、咨詢(可以做,會(huì)做的態(tài)度),冷靜的壓力下(堅(jiān)持,應(yīng)變能力,適應(yīng)性和模糊性),計(jì)算,和關(guān)鍵思想家(客觀分析儀)。

多元化觀點(diǎn)的益處是多方面的。它們使提出的問題更有趣,但更重要的是,它們使答案更有趣、有用、有益。更大的背景下的答案可以產(chǎn)生更大的影響。成熟的數(shù)據(jù)科學(xué)能力意味著,你需要的不僅僅是數(shù)學(xué)或計(jì)算機(jī)科學(xué)方面的人。成熟的組織能夠完美整合業(yè)務(wù)專家、中小企業(yè)、“數(shù)據(jù)講故事的人”,創(chuàng)新的“數(shù)據(jù)藝術(shù)家”,然后給予他們探索和發(fā)掘數(shù)據(jù)資產(chǎn)的全部權(quán)力的自由。這種富有多樣性的團(tuán)隊(duì)輸出將比任何紫色獨(dú)角獸更為豐富。記住,擁有一匹馬和一頭鯨比獨(dú)角獸更好!

6.……毫不留情地問正確的問題,并不斷尋找下一個(gè)。

一個(gè)成功的、成熟的數(shù)據(jù)科學(xué)能力的基礎(chǔ)是能夠提出正確數(shù)據(jù)類型問題的能力。這是基于理解企業(yè)如何運(yùn)作或經(jīng)營的挑戰(zhàn)體現(xiàn)在自身身上。最好的數(shù)據(jù)科學(xué)團(tuán)隊(duì)有著前面提到的所有優(yōu)秀品質(zhì)(見“5…吸引和保留不同的參與者,使他們自由地探索?!保汉闷妗?chuàng)意、溝通、協(xié)作、勇敢的問題解決者、終身學(xué)習(xí)者、實(shí)干者、有韌性。

成熟的數(shù)據(jù)科學(xué)能力的展現(xiàn)在不懈追求新問題(甚至可能是之前永遠(yuǎn)不會(huì)被問到的問題)和在問題中提出疑問!數(shù)據(jù)科學(xué)成熟使組織能夠從企業(yè)的整體層面上去提出一些尖銳的問題,只需規(guī)定如何詢問這些問題,而不害怕得到“錯(cuò)誤的答案”。

在這種情況下,隨著數(shù)據(jù)科學(xué)能力的成熟的是分析能力的成熟。高級分析往往被描述為超越傳統(tǒng)商業(yè)智能的分析的新階段,包括描述性分析(后見)和診斷分析(監(jiān)督)。當(dāng)前高級分析包括了這些新階段:預(yù)測分析(遠(yuǎn)見)和規(guī)范分析(充分地洞察你的業(yè)務(wù),知道哪些決定、行動(dòng)或干預(yù)將導(dǎo)致最佳的、最優(yōu)的結(jié)果)。分析的下一個(gè)新興階段成熟是認(rèn)知分析(“正確的景象”)-知道你的數(shù)據(jù)(在正確的時(shí)間,在正確的語境,正確的使用案例。這種“認(rèn)知”的能力不只是得到正確的答案,還要能提出正確的問題(特別是從來沒有被要求或考慮的問題)。分析成熟度是數(shù)據(jù)科學(xué)能力的最高水平成熟。正如諺語所說:“最壞的問題是你不問的那個(gè)問題?!?

7.……感謝快速失敗(fast-fail)的合作文化。

文化是一種很難定義的東西,但是如果你用文化來評估一個(gè)團(tuán)隊(duì),它是很好的指標(biāo)。有些組織害怕失敗,或有一種“不贊成”文化。他們更加注重戰(zhàn)略而不是文化。但不少企業(yè)專家提醒我們“文化早餐策略(或午餐)”,因此,你對數(shù)據(jù)科學(xué)文化所做的準(zhǔn)備要早于你的數(shù)據(jù)科學(xué)策略。承認(rèn)錯(cuò)誤是一回事,但有目的地用你的數(shù)據(jù)去探索未知并不是一個(gè)錯(cuò)誤。你可以通過自我提問測試你的組織成熟度:當(dāng)我的假設(shè)失敗時(shí)會(huì)發(fā)生什么?快速失敗的心態(tài)就是這句話表達(dá)的含義:“好的判斷來自經(jīng)驗(yàn)。而經(jīng)驗(yàn)來自壞的判斷。”

真實(shí)的數(shù)據(jù)科學(xué)(基于嚴(yán)謹(jǐn)?shù)目茖W(xué)方法論,見4.……遵循嚴(yán)格的科學(xué)方法,即測量、實(shí)驗(yàn)、紀(jì)律化、迭代、精煉所需的假設(shè))探索那些可以通過agility的多個(gè)假設(shè)的迭代很快學(xué)會(huì)的事物。這可能需要你邀請你的業(yè)務(wù)合作伙伴探討你的數(shù)據(jù)‐使用DataOps(見“2.……全面使用Agile并利用dataops(即DevOps的數(shù)據(jù)產(chǎn)品開發(fā))”)。擁有數(shù)據(jù)和工具直接關(guān)系到它的成功和成熟(見“1.……將所有數(shù)據(jù)和數(shù)據(jù)訪問對其成員開放?!保3墒斓臄?shù)據(jù)科學(xué)能力會(huì)考慮到一個(gè)迭代的fast-fail文化可能會(huì)幫你實(shí)現(xiàn)最有價(jià)值的發(fā)現(xiàn),做出以證據(jù)為基礎(chǔ)的最好的決定,并為您的組織提供最具創(chuàng)新性的選擇。

一個(gè)項(xiàng)目失敗的陰影往往難以被克服。很難界定花費(fèi)有限的資源卻發(fā)現(xiàn)假設(shè)是錯(cuò)誤的——來自知道在文化中那些沒有做的事常常會(huì)失去或不被慶祝的價(jià)值。一個(gè)成熟的數(shù)據(jù)科學(xué)能力和傳統(tǒng)的A/B測試相似。設(shè)計(jì)實(shí)驗(yàn)來測試、用評估替代假說,其中一個(gè)可能包括一些干預(yù)或調(diào)整(治療樣本)二是零假設(shè)(適用于控制,未經(jīng)處理的樣品)。通常情況下,這些實(shí)驗(yàn)中的一個(gè)將失敗,另一個(gè)不會(huì)。這是一個(gè)測試的全部要點(diǎn)。如果一個(gè)組織不能接受失敗,那么他們就無法獲得成熟的數(shù)據(jù)科學(xué)。

值得強(qiáng)調(diào)的是,快速失敗構(gòu)成了機(jī)器學(xué)習(xí)算法的分析基礎(chǔ)。具體而言,許多分類算法的目標(biāo)是盡可能準(zhǔn)確地定義邊界(盡管是復(fù)雜的)來區(qū)分不同類別的對象。

這個(gè)邊界可能是線性的(例如,如果你的團(tuán)隊(duì)比我的團(tuán)隊(duì)獲得更多分?jǐn)?shù),你便獲勝),它也有可能是傾斜的(例如,如果你A+B兩門考試的總成績是140(滿分200)然后你便通過這門課程),或者它可能很復(fù)雜(當(dāng)你處理高維的復(fù)雜數(shù)據(jù)時(shí),超平面能夠用支持向量機(jī)SVM)算法將兩個(gè)類別區(qū)分開來)。

為了在復(fù)雜的分類規(guī)則之間劃分邊界(例如,商業(yè)決策、產(chǎn)品選擇或類標(biāo)簽),這個(gè)問題的空間可以表示為一個(gè)在不同區(qū)域的邊界被精確地定義的映射的練習(xí)。

沿每一個(gè)“英寸”確定邊界的位置需要詳細(xì)、全面的調(diào)查。例如,如果你想檢驗(yàn)當(dāng)你打折時(shí)你的客戶會(huì)在黑色星期五購買你的產(chǎn)品這一假設(shè),那么你需要嘗試多種折扣(10%,20%,30%,40%,甚至0%)看哪里是真正的邊界。在確定你的投資回報(bào)率優(yōu)化的邊界上,你的利潤率是非常關(guān)鍵的,這意味著尋找邊界兩側(cè)的點(diǎn)(失敗和成功的條件),直到找尋邊界點(diǎn)最后形成一個(gè)框架。在這種情況下,快速失敗是必要的,否則資源投資就浪費(fèi)了。

8.……通過插圖和講故事來展示自己的見解

大多數(shù)組織都有某種形式的報(bào)告。這通常集中產(chǎn)生于月度或每周回顧中,其中折線圖、柱狀圖或餅圖會(huì)說明了在報(bào)告中的時(shí)間內(nèi)發(fā)生了什么。這意味著,該組織的能力不會(huì)超越問“發(fā)生了什么,什么時(shí)候?”這個(gè)水平,它局限于描述性分析的世界里。它為預(yù)測和規(guī)范分析的興起提供契機(jī)。因此,成熟的數(shù)據(jù)科學(xué)組織將會(huì)問:“為什么會(huì)發(fā)生這樣的事情,接下來會(huì)發(fā)生什么,我們能做什么來取得更好的結(jié)果?”并且組織可以通過詢問“我應(yīng)該對我的數(shù)據(jù)提出什么問題?”取得進(jìn)一步成熟。

當(dāng)有洞察力的產(chǎn)生來回答“如果怎么樣會(huì)怎么樣”問題(“什么可能發(fā)生”或“什么是所有可能的結(jié)果,如果我們…?),這些回答不能被簡化為一個(gè)直線圖或條形圖來說明結(jié)果的影響。圖表、美麗獨(dú)特的插圖不僅是你努力工作的證明,更會(huì)產(chǎn)生關(guān)鍵性的影響。成熟的數(shù)據(jù)科學(xué)能力聚焦于更難回答的問題,然后用新的和創(chuàng)造性的方式回答(說明),故事,和見解,數(shù)據(jù)顯示出來。

因此,成熟的數(shù)據(jù)科學(xué)團(tuán)隊(duì)包括一個(gè)或更多的以藝術(shù)家的角度描繪數(shù)據(jù)和用數(shù)據(jù)講故事的人。故事和可視化是我們在事實(shí)間建立聯(lián)系的地方。它們使聽者能夠更好地理解上下文(什么?),為什么(這么說?),以及“什么將在未來發(fā)生”(現(xiàn)在會(huì)發(fā)生什么?)。

9.……建立價(jià)值證明,而不是概念證明。

許多組織寄希望于從現(xiàn)成的數(shù)據(jù)科學(xué)中尋找答案。他們想利用供應(yīng)商告訴他們會(huì)解決他們的問題特定的工具,所以他們成立了一個(gè)Hadoop環(huán)境(或類似的),將數(shù)據(jù)導(dǎo)入到它,問一個(gè)問題,看看系統(tǒng)是否有提供了現(xiàn)成的“正確答案”!對嗎?

錯(cuò)!

成熟的數(shù)據(jù)科學(xué)能力意味著有條理地安排你的試驗(yàn)。什么是你真正希望你的試驗(yàn)證明的概念或真正的商業(yè)價(jià)值?價(jià)值證明改變了工作的價(jià)值命題。所以,更多的關(guān)注于價(jià)值(回答新的問題,開拓新的市場,獲得新的見解),而不是那些你已經(jīng)知道了答案的問題。因此,專注證明你正在建設(shè)的數(shù)據(jù)科學(xué)能力將是一個(gè)持續(xù)證明價(jià)值的旅程,(例如,10倍于許多我們已有的經(jīng)驗(yàn)),這將解決組織最大的“未知的未知數(shù)?!?

建立與價(jià)值的思想,用Agile來武裝你所做的(見2.……全面使用Agile并利用dataops(即DevOps的數(shù)據(jù)產(chǎn)品開發(fā)))。DataOps文化慶祝成功的MVP(最小可行產(chǎn)品)-盡可能快的提供有價(jià)值的產(chǎn)品(而不是概念證明),從而使團(tuán)隊(duì)走向下一個(gè)成功。

10.…將數(shù)據(jù)科學(xué)作為一種做事方式,而不是一件要做的事。

數(shù)據(jù)科學(xué)不僅僅是一個(gè)口號,或只是數(shù)據(jù)分析師或商業(yè)智能功能的一個(gè)標(biāo)簽。不要把它用來做一個(gè)更好的月度報(bào)告(“請呈上TPS報(bào)告封面”)。它當(dāng)然不是一勞永逸的。

數(shù)據(jù)科學(xué)是組織思考方法和運(yùn)作模式的根本轉(zhuǎn)變。它包括以數(shù)據(jù)為核心的所有功能,是一種新的有趣的方式,使組織更具創(chuàng)新性。成熟的數(shù)據(jù)科學(xué)能力的證據(jù)是一個(gè)組織相信并以此為信條:“我們現(xiàn)在是時(shí)候開始思考將數(shù)據(jù)科學(xué)作為一種職業(yè),而不是工作;作為企業(yè)文化,而不是企業(yè)議程;作為一種戰(zhàn)略,而不是一個(gè)計(jì)謀;作為一種核心競爭力,而不是一個(gè)過程;作為一種行事方法,而不是一件要做的事情。”

最后,我們提供一些組織可能需要的識(shí)別當(dāng)前成熟度的指標(biāo),以及國家走向大數(shù)據(jù)科學(xué)成熟的建議指標(biāo)。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }