
企業(yè)大數(shù)據(jù)如何起步:從小數(shù)據(jù)到大數(shù)據(jù)
目前國內(nèi)外關(guān)于大數(shù)據(jù)的談?wù)摵芏?,大多是談運(yùn)營級別的,或者說從服務(wù)端、服務(wù)方提得較多一些。筆者要跟大家交流的問題是作為各類企業(yè)尤其是客戶方的企業(yè)來說,大數(shù)據(jù)跟他們有什么關(guān)系,或者說作為企業(yè)方怎樣去參與,這是企業(yè)方現(xiàn)在面臨的最大問題。
這個問題的答案重點(diǎn)在于大數(shù)據(jù)應(yīng)該從小數(shù)據(jù)開始。因?yàn)楝F(xiàn)在很多企業(yè)面臨的最大問題不是怎么用大數(shù)據(jù),而是內(nèi)部的一些小數(shù)據(jù)整合出現(xiàn)問題,或者小數(shù)據(jù)都沒用好的情況下怎么用大數(shù)據(jù)。大數(shù)據(jù)應(yīng)該是從小數(shù)據(jù)逐漸演變上去的,是一個正常的生態(tài),而不是瞬間變化的。大數(shù)據(jù)這個概念跟自媒體的概念類似,需要企業(yè)自己去建設(shè),而不是從一開始就想著依靠別人。很多企業(yè)在談自媒體的時候,像談別人的事情一樣。比如一談自媒體,就覺得那是第三方提供的一個平臺,大家在那兒發(fā)發(fā)牢騷。自媒體是自己的媒體,企業(yè)自己也要參與進(jìn)去。同樣大數(shù)據(jù)不是別人的大數(shù)據(jù),我們假設(shè)有一個第三方提供了大量的數(shù)據(jù),有很多很多信息,CI、BI之類的很多模塊化東西供我們來用。如果這樣的話,你有,競爭對手也有,你能得到的東西,競爭對手也能得到的情況下,就不能稱之為核心競爭力。大數(shù)據(jù)作為企業(yè)來說要變成自身的一個競爭力,企業(yè)必須得建立自己的企業(yè)級的數(shù)據(jù)。
要做大數(shù)據(jù),首先要了解自己的企業(yè),或者自己所在的行業(yè)的核心是什么。我們現(xiàn)在經(jīng)常發(fā)現(xiàn),有很多企業(yè)在競爭的過程中,最終不是被現(xiàn)在的競爭對手打敗,而是被很多不是你的競爭對手所打敗。很簡單的一個例子,大家都認(rèn)為亞馬遜是做電商的,但這是錯的,它現(xiàn)在最主要的收入來自于云(云服務(wù))。也就是說企業(yè)需要找到自己的核心數(shù)據(jù)(價值),這個是最關(guān)鍵的。只有在這個基礎(chǔ)上,建立自己的大數(shù)據(jù)才有可能,才能做一些延伸。其次,要找到內(nèi)部的一些外圍相關(guān)數(shù)據(jù),去慢慢地成長它。有點(diǎn)像滾雪球,第一層是核心,第二層是外圍相關(guān)的數(shù)據(jù)。第三層是什么?就是外部機(jī)構(gòu)的一些結(jié)構(gòu)化數(shù)據(jù)。第四層是社會化的,以及各種現(xiàn)在所謂的非結(jié)構(gòu)化的數(shù)據(jù)。這幾層要一層一層地找到它,而且要找到與自己相關(guān)的有價值的東西。這樣你的大數(shù)據(jù)才能建立起來。
第一步,找到核心數(shù)據(jù)。核心數(shù)據(jù)現(xiàn)在對很多企業(yè)來說實(shí)際上就是CRM,自己的用戶系統(tǒng),這是最重要的。第二步,外圍數(shù)據(jù)。比如企業(yè)經(jīng)常會在線上線下舉辦一些活動,在做活動的時候,消費(fèi)者的信息只是簡單地提供在表單里面,還是進(jìn)入了CRM的系統(tǒng)里? 第三步,常規(guī)渠道的數(shù)據(jù)。舉例來說一個銷售快銷品的企業(yè),能不能夠得到沃爾瑪?shù)臄?shù)據(jù),家樂福的數(shù)據(jù)?很多國外大數(shù)據(jù)的案例,說消費(fèi)者買啤酒的時候也會購買剃須刀之類,或者一個母嬰產(chǎn)品的消費(fèi)者她今天在買這個產(chǎn)品,預(yù)示著她后面必然會買另一個產(chǎn)品。這就有一個前期的挖掘。這些價值怎么來的,這就需要企業(yè)去找常規(guī)渠道里面的數(shù)據(jù),跟自己的CRM結(jié)合起來,才能為自己下一步做市場營銷、做推廣、產(chǎn)品創(chuàng)新等建立基礎(chǔ)。第四步,外部的社會化的或者非結(jié)構(gòu)化的數(shù)據(jù),即現(xiàn)在所謂的社會化媒體數(shù)據(jù)。這方面信息的主要特征是非結(jié)構(gòu)化,而且非常龐大。這對企業(yè)來說最大的價值是什么?當(dāng)你的用戶在社會化媒體上發(fā)言的時候,你有沒有跟他建立聯(lián)系?這里有個概念叫做DC(digital connection)。所謂的互聯(lián)網(wǎng)實(shí)際就是一種DC,但是通常互聯(lián)網(wǎng)上的那種DC是在娛樂層面。用到商業(yè)里面的話,就是企業(yè)必須得跟消費(fèi)者建立這種DC關(guān)系,它的價值才能發(fā)揮出來。否則,你的數(shù)據(jù)以及很多的CRM數(shù)據(jù)都是死的。就像國外CRM之父Paul Greenberg寫的四本CRM相關(guān)書籍,前面三本都是在講數(shù)據(jù)庫、系統(tǒng)之類的。第四本書的時候,就沒有再講那些東西,講什么?講互動,講DC,講怎么跟消費(fèi)者建立關(guān)系。
有了這個數(shù)據(jù)庫去進(jìn)行數(shù)據(jù)挖掘,或者在建立數(shù)據(jù)的過程中,企業(yè)需要從什么方向去探索,也不是漫無目的的。首先應(yīng)該跟著你的業(yè)務(wù),業(yè)務(wù)現(xiàn)在有哪些問題,或者說這個行業(yè)里面主要的競爭點(diǎn)在哪里,這是很關(guān)鍵的。有了這個業(yè)務(wù)關(guān)系以后,再形成假設(shè),也就是說未來的競爭點(diǎn)可能在哪里,大到未來的戰(zhàn)略競爭,小到哪些方面。然后下一步要怎么做,這些形成一個假設(shè),其次做一些小樣本的測試。很多企業(yè)一看大數(shù)據(jù)就很恐怖,說我也買不起那些大數(shù)據(jù),也雇不起那么專業(yè)的團(tuán)隊(duì),怎么辦?自己做一些小樣本的測試,甚至通過電子表格Excel都可以做數(shù)據(jù)挖掘。不一定非要那么龐大、那么貴的數(shù)據(jù)。然后再做大樣本的驗(yàn)證,驗(yàn)證出來的結(jié)果就可以應(yīng)用到現(xiàn)實(shí)中去。
在大數(shù)據(jù)尤其是互聯(lián)網(wǎng)時代還有一個最重要的點(diǎn),就是失效預(yù)警。即你發(fā)現(xiàn)一個規(guī)律,在現(xiàn)實(shí)中應(yīng)用了,但是你一定要設(shè)立一些預(yù)警指標(biāo)。就是當(dāng)指標(biāo)達(dá)到什么程度的時候,之前發(fā)現(xiàn)的規(guī)律失效,那你就必須發(fā)現(xiàn)新的、相關(guān)的,否則也會造成一種浪費(fèi)。筆者看到一篇文章,其中有一個重要結(jié)論。大家都在說大數(shù)據(jù)的價值很有用的時候,很多企業(yè)說我積累了多少TB,多少PB,但是你基于老的數(shù)據(jù)得出的很多結(jié)論實(shí)際是在浪費(fèi)你的資源。你挖掘出來很多數(shù)據(jù)、很多規(guī)律,如果錯了,明天按這個去做,就是浪費(fèi)。因此需要有一個失效預(yù)警。在這樣的過程中,最終你需要對應(yīng)建立起內(nèi)部團(tuán)隊(duì),他們對數(shù)據(jù)的敏感度也才能培養(yǎng)起來。這時候你再去買大數(shù)據(jù)服務(wù)的時候才是有價值的。
所有這些工作作為企業(yè)來說是需要內(nèi)部去做的,最終才能開花結(jié)果,有一些收獲。企業(yè)大數(shù)據(jù)起步,要從小數(shù)據(jù)開始。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03