
企業(yè)想要成功布局大數(shù)據(jù)的七大關(guān)鍵步驟
在這個(gè)大數(shù)據(jù)已經(jīng)成為市場(chǎng)一個(gè)美味的“大蛋糕”的今日,大多數(shù)企業(yè)都很想要分得一塊。大多數(shù)企業(yè)正做好了布局大數(shù)據(jù)的準(zhǔn)備,那么,該怎么做才能成功去布局?
最近,電子科技大學(xué)教授,云基地大數(shù)據(jù)實(shí)驗(yàn)室合伙人周濤在接受采訪時(shí)提出,對(duì)于普通企業(yè)要通過修煉成為大數(shù)據(jù)企業(yè),關(guān)鍵要做好7個(gè)步驟:
1.要實(shí)現(xiàn)數(shù)據(jù)化。企業(yè)要為此做好計(jì)劃,到底需要保存什么樣的數(shù)據(jù),以人為中心的數(shù)據(jù)還是以產(chǎn)品為中心,還是更關(guān)注企業(yè)運(yùn)營,需要做好這樣的計(jì)劃,然后再將企業(yè)生產(chǎn)經(jīng)營中的數(shù)據(jù)保存下來,即便是現(xiàn)在看來沒什么用的數(shù)據(jù),未來也可能產(chǎn)生巨大的價(jià)值。比如說像售樓處、體驗(yàn)店客戶的來訪數(shù)據(jù),就有必要完整的記錄下來。包括怎么過來的,一個(gè)人來還是幾個(gè)人,有老人和小孩嗎,穿什么樣的衣服等等,還有客戶的情緒,看了什么,問了什么問題,最后買了什么東西,都是非常重要的數(shù)據(jù)。
另外,企業(yè)內(nèi)部人力資源的各個(gè)方面也都可以記錄下來,這些可以進(jìn)行挖掘和分析的數(shù)據(jù)。他舉例說,長虹公司在自己的生產(chǎn)線設(shè)置了很多傳感器,監(jiān)測(cè)溫度、濕度、震動(dòng)、噪音、顆粒等等因素,希望了解到生產(chǎn)過程中哪些因素會(huì)對(duì)員工產(chǎn)生明顯影響。他們此前都認(rèn)為溫度和顆??赡軐?duì)于員工操作和產(chǎn)品質(zhì)量影響最大,但是事實(shí)上最終數(shù)據(jù)分析的結(jié)果,溫度是沒有什么影響的,恒溫的控制對(duì)于生產(chǎn)效率和合格率的貢獻(xiàn)并不像想象中那么大,反而是噪音對(duì)于員工情緒以及生產(chǎn)的影響非常重要。要成為大數(shù)據(jù)企業(yè),第一步企必須要實(shí)現(xiàn)數(shù)據(jù)化。
2.企業(yè)要自己培養(yǎng)一些大數(shù)據(jù)理念,或者是小數(shù)據(jù)挖掘的團(tuán)隊(duì)。做大數(shù)據(jù),企業(yè)的規(guī)模不一樣,要求也不一樣。如果企業(yè)規(guī)模足夠大,比如說是電信運(yùn)營商或者電力、銀行這樣的行業(yè),可能會(huì)形成一個(gè)大數(shù)據(jù)的團(tuán)隊(duì)。如果不是,比如說就是簡(jiǎn)單的服務(wù)企業(yè),那么形成理念就可以了?,F(xiàn)在我們認(rèn)為比較好的數(shù)據(jù)科學(xué)家,也不是說就是特別擅長或適應(yīng)網(wǎng)絡(luò),這樣的人不重要了,重要的是要有武器,什么樣的問題來了知道怎么解決。
關(guān)鍵我們認(rèn)識(shí)是要培養(yǎng)四種理念:
(1)除了結(jié)構(gòu)化數(shù)據(jù)以外還有文本、音頻、圖像、遙感、網(wǎng)絡(luò)、行為軌跡、時(shí)間數(shù)據(jù),這些數(shù)據(jù)怎么處理,它存在的大挑戰(zhàn)是什么。
(2)一定要懂預(yù)測(cè),因?yàn)榻^大部分的大數(shù)據(jù)應(yīng)用回到預(yù)測(cè)中,預(yù)測(cè)里面很多方法都是基準(zhǔn)學(xué)習(xí)的,而基準(zhǔn)學(xué)習(xí)目前最火的方向是集群學(xué)習(xí)。
(3)要走分布式存儲(chǔ)計(jì)算,這絕對(duì)不是說我知道給Hadoop
、Mapreduce、Hbase就夠了,關(guān)鍵問題是首先要知道怎么樣去搭一個(gè)混合式的,你的數(shù)據(jù)來了,我到底是應(yīng)該犧牲我的一致性還是犧牲操作性,大概的成本多少,哪些數(shù)據(jù)挖掘的重要算法我要把他Hadoop、Mapreduce實(shí)現(xiàn),哪些算法要通過SPTA,可變邏輯治理是在硬件里面,從而替代CPU、GPU。
(4)需要整個(gè)數(shù)據(jù)向外的發(fā)展,知道哪些數(shù)據(jù)可能在外部產(chǎn)生什么樣的重要價(jià)值,或者外部的數(shù)據(jù)能夠在你的企業(yè)產(chǎn)生什么樣的重要價(jià)值。企業(yè)應(yīng)該培養(yǎng)出這四個(gè)能力,建立起企業(yè)數(shù)據(jù)挖掘的人才團(tuán)隊(duì)。
3.企業(yè)一定要做好自己的外部數(shù)據(jù)儲(chǔ)備。我們都說“書到用時(shí)方恨少”,很多的企業(yè),比如說像服裝銷售這樣的傳統(tǒng)行業(yè),我要進(jìn)的貨在淘寶、天貓上賣的怎么樣?在淘寶、天貓哪一個(gè)店鋪怎么樣?它的競(jìng)爭(zhēng)品牌是什么樣售價(jià),怎么樣銷售的?對(duì)于這樣一些數(shù)據(jù),如果到需要的時(shí)候才去找,往往都來不及了。同樣的道理。比如銀行給中小企業(yè)發(fā)放貸款的時(shí)候,希望了解到它的用水、用電、生產(chǎn)、交通數(shù)據(jù),例如通過攝像頭就能知道這個(gè)企業(yè)到底有多少車運(yùn)行,這些數(shù)據(jù)可能對(duì)于中小企業(yè)發(fā)放貸款決策都很重要。但是當(dāng)你要發(fā)貸款的時(shí)候,再去問已經(jīng)沒有機(jī)會(huì)了,或者說成本太高了。我們建議,企業(yè)應(yīng)該學(xué)會(huì)通過公共渠道或者數(shù)據(jù)交換的方法,根據(jù)自己的業(yè)務(wù)需求來量身定做自己的外部數(shù)據(jù)和戰(zhàn)略數(shù)據(jù)。
4.企業(yè)要建設(shè)自己的大數(shù)據(jù)管理與應(yīng)用平臺(tái)。對(duì)于很多企業(yè),做大數(shù)據(jù)并不是意味著要自己去建設(shè)數(shù)據(jù)中心。隨著云計(jì)算和云數(shù)據(jù)中心出現(xiàn),使用外部數(shù)據(jù)中心的成本已經(jīng)非常低了,數(shù)據(jù)存儲(chǔ)的費(fèi)用也是在成倍的下降。但是,企業(yè)要做大數(shù)據(jù),必須要在IT基礎(chǔ)設(shè)施方面具有比較好的數(shù)據(jù)處架構(gòu),要用大一些工具比如數(shù)據(jù)分布式存儲(chǔ)、Hadoop等等。很關(guān)鍵的企業(yè)不僅要具備一個(gè)數(shù)據(jù)中心的硬件,還要考慮和企業(yè)業(yè)務(wù)方向結(jié)合,不僅就是包括了數(shù)據(jù)的采集、數(shù)據(jù)庫架構(gòu),向上的分析模塊,再往上的API數(shù)據(jù)出口,以及橫向的一些業(yè)務(wù)模塊和出口這些東西。要做成企業(yè)的大數(shù)據(jù)管理應(yīng)用平臺(tái),我們強(qiáng)調(diào)一定要從企業(yè)的業(yè)務(wù)出發(fā),量體裁衣,企業(yè)首先必須要搞清楚自己的業(yè)務(wù)形態(tài)是什么。
5.大企業(yè)一定要有數(shù)據(jù)偵測(cè)的能力,需要有創(chuàng)新思維的人隨時(shí)思考這些問題,比如企業(yè)占有的數(shù)據(jù)到底在外部能夠產(chǎn)生什么樣大的作用。就像我們經(jīng)常拿雅昌藝術(shù)中心的例子,它存了很多藝術(shù)品的數(shù)據(jù),所以最后它可以發(fā)布藝術(shù)指數(shù)。同樣國家電網(wǎng)也發(fā)布兩個(gè)指數(shù),一個(gè)叫重工業(yè)用電指數(shù),一個(gè)叫輕工業(yè)用電指數(shù)。淘寶網(wǎng)有它的CPI指數(shù),還有很多企業(yè)的一些數(shù)據(jù),實(shí)際上都可以發(fā)揮想象不到的價(jià)值。
6.一個(gè)大數(shù)據(jù)企業(yè)包括未來現(xiàn)代化企業(yè),一定要有開放共享的態(tài)度。一方面需要企業(yè)把自己的很多問題社會(huì)化,另一方面企業(yè)要盡量去通過一些平等辦法,通過數(shù)據(jù)交換的方式互相共享形成數(shù)據(jù)化。
7.企業(yè)還要做好數(shù)據(jù)方面的戰(zhàn)略投資。我認(rèn)為有三種比較先進(jìn)的模式。
一種模式叫做產(chǎn)業(yè)鏈布局,比如說海爾、長虹可以投物聯(lián)網(wǎng),對(duì)物聯(lián)網(wǎng)企業(yè)創(chuàng)新進(jìn)行投入。比如說中信集團(tuán)可以關(guān)注醫(yī)療,在這個(gè)方面尋找相關(guān)的數(shù)據(jù)應(yīng)用。
第二個(gè)方面就是技術(shù),你要知道哪些是硬技術(shù)創(chuàng)新,特別是在基礎(chǔ)術(shù)設(shè)施層面的,比如加速存儲(chǔ),云計(jì)算的一些技術(shù),比如數(shù)據(jù)挖掘,垂直應(yīng)用分析,這個(gè)方面集中了很多創(chuàng)新也可以形成很大的規(guī)模。
第三種模式是數(shù)據(jù)集方面的投資,我們知道阿里巴巴投資高德是為了數(shù)據(jù),它投資新浪微博不僅是要投錢還要花錢買數(shù)據(jù),所有這一切本質(zhì)還是想把數(shù)據(jù)流動(dòng)起來做更大的事情。這種投資就是集成數(shù)據(jù),強(qiáng)調(diào)數(shù)據(jù)流動(dòng)性。這些投資里面有幾點(diǎn)是需要注意的,一是要去關(guān)注企業(yè)的數(shù)據(jù)價(jià)值,其次要關(guān)注早期的投資,去長期指引而不是短期追逐回報(bào)率,最后還要多關(guān)注傳統(tǒng)行業(yè)。
周濤教授提出,大數(shù)據(jù)的本質(zhì)不在于數(shù)據(jù)量有多少,也不在于是否是異構(gòu)的數(shù)據(jù),而是在于數(shù)據(jù)是關(guān)聯(lián)的,整體的數(shù)據(jù)可以流動(dòng)起來。他認(rèn)為,跨領(lǐng)域關(guān)聯(lián),通過一加一產(chǎn)生遠(yuǎn)大于二的價(jià)值才是大數(shù)據(jù)的精髓。
當(dāng)然,數(shù)據(jù)本身并不產(chǎn)生價(jià)值,只有通過大數(shù)據(jù)的分析去解決難題才是價(jià)值,而大數(shù)據(jù)對(duì)于企業(yè)營銷的作用是可大可小的,不過在這個(gè)把大數(shù)據(jù)作為概念的時(shí)代,企業(yè)還是要做好布局大數(shù)據(jù)的準(zhǔn)備,向大數(shù)據(jù)企業(yè)修煉。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03