
深入淺出為你解析關(guān)于大數(shù)據(jù)的所有事情
大數(shù)據(jù)是什么?為什么要使用大數(shù)據(jù)?大數(shù)據(jù)有哪些流行的工具?本文將為您解答。現(xiàn)在,大數(shù)據(jù)是一個被濫用的流行詞,但是它真正的價值甚至是一個小企業(yè)都可以實現(xiàn)。
通過整合不同來源的數(shù)據(jù),比如:網(wǎng)站分析、社交數(shù)據(jù)、用戶、本地數(shù)據(jù),大數(shù)據(jù)可以幫助你了解的全面的情況。大數(shù)據(jù)分析正在變的越來越容易,成本越來越低,而且相比以前能更容易的加速對業(yè)務(wù)的理解。
大數(shù)據(jù)通常與企業(yè)商業(yè)智能(BI)和數(shù)據(jù)倉庫有共同的特點:高成本、高難度、高風(fēng)險。
以前的商業(yè)智能和數(shù)據(jù)倉庫的舉措是失敗的,因為他們需要花費數(shù)月甚至是數(shù)年的時間才能讓股東得到可以量化的收益。然而事實并非如此,實際上你可以在當(dāng)天就獲得真實的意圖,至少是在數(shù)周內(nèi)。
為什么使用大數(shù)據(jù)?
數(shù)據(jù)在呈爆炸式的速度增長。其中一個顯著的例子來自于我們的客戶,他們大多使用谷歌分析。當(dāng)他們分析一個長時間段數(shù)據(jù)或者使用高級細(xì)分時,谷歌分析的數(shù)據(jù)開始進行抽樣,這會使得數(shù)據(jù)的真正價值被隱藏。
現(xiàn)在我們的工具Clickstreamr可以收集點擊級的巨量的數(shù)據(jù),因此你可以追蹤用戶在他們訪問路徑(或者訪問流)中的每一個點擊行為。另外,如果你加入一些其他的數(shù)據(jù)源,他就真正的變成了大數(shù)據(jù)。
更完整的解析
大數(shù)據(jù)并不僅僅是大量的數(shù)據(jù)。他的真正意義在于根據(jù)相關(guān)的數(shù)據(jù)背景,來完成一個更加完整的報告。舉個例子,如果你把你的CRM數(shù)據(jù)加入到你網(wǎng)站的數(shù)據(jù)分析當(dāng)中,你可能就會找到你早就知道的高價值用戶群。她們是女性,住在西海岸,年齡30至45,花費了大量的時間在Pinterest和Facebook。
現(xiàn)在你已經(jīng)被這些知識武裝起來了,那就是如何有效的設(shè)定和獲取更多高價值的用戶。
類似Tableau和谷歌這樣的公司給用戶帶來了更加強大的數(shù)據(jù)分析工具(比如:大數(shù)據(jù)分析)。Tableau提供了一個可視化分析軟件的解決方案,每年的價格是2000美金。谷歌提供了BigQuery工具,他可以允許你在數(shù)分鐘內(nèi)分析你的數(shù)據(jù),并且可以滿足任何的預(yù)算要求。
大數(shù)據(jù)是什么?
由于大數(shù)據(jù)往往是一個混合結(jié)構(gòu)、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),因此大數(shù)據(jù)變得難以關(guān)聯(lián)、處理和管理,特別是和傳統(tǒng)的關(guān)系型數(shù)據(jù)庫。當(dāng)談到大數(shù)據(jù)的時候,高德納公司(Gartner Group,成立于1979年,它是第一家信息技術(shù)研究和分析的公司)的分析師把它分成個3個V加以區(qū)分:
量級(Volume):大量的數(shù)據(jù)
速率(Velocity):高速的數(shù)據(jù)產(chǎn)出
多樣性(Variety):多種類型和來源的數(shù)據(jù)。
正如我們所說,大部分的企業(yè)每一天在不同的領(lǐng)域都在產(chǎn)出大量的數(shù)據(jù)。這里給出一組樣本數(shù)據(jù)的來源及類型,他們都是企業(yè)在做大數(shù)據(jù)分析時潛在的收集和聚合數(shù)據(jù)的方式:
網(wǎng)站分析
移動分析
設(shè)備/傳感器數(shù)據(jù)
用戶數(shù)據(jù)(CRM)
統(tǒng)一的企業(yè)數(shù)據(jù)(ERP)
社交數(shù)據(jù)
會計系統(tǒng)
銷售點系統(tǒng)
銷售體系
消費者數(shù)據(jù)(例如益佰利的數(shù)據(jù)、鄧氏商聯(lián)的數(shù)據(jù)或者普查數(shù)據(jù))
公司內(nèi)部電子表格
公司內(nèi)部數(shù)據(jù)庫
位置數(shù)據(jù)(空間位置、GPS定位的位置)
天氣數(shù)據(jù)
但是針對無限的數(shù)據(jù)來源,不要去做太多事情。把焦點放在相關(guān)的數(shù)據(jù)上,并且從小的數(shù)據(jù)開始。通常以2-3種數(shù)據(jù)源開始是一個好的建議,比如網(wǎng)站數(shù)據(jù)、消費者數(shù)據(jù)和CRM,這些會讓你得到一些有價值的見解。在你最初進入大數(shù)據(jù)分析之后,你可以開始添加數(shù)據(jù)源來促進你的分析,并且公布更多的分析結(jié)果。
想要獲得更多關(guān)于大數(shù)據(jù)細(xì)節(jié)的知識,可以去查閱維基百科的大數(shù)據(jù)詞條。
大數(shù)據(jù)的好處
大數(shù)據(jù)提供了一種識別和利用高價值機會的前瞻性方法。如果你想,那么大數(shù)據(jù)可以提供如下好處:
根據(jù)數(shù)據(jù)背景獲得更完整的情況
利用數(shù)據(jù)驅(qū)動做出更好的商業(yè)決策
降低商業(yè)風(fēng)險
市場上最好的解決方案
開發(fā)出更好的定制化產(chǎn)品或服務(wù)
更好的預(yù)測客戶的需求和想法
迅速適應(yīng)市場
在實時數(shù)據(jù)的趨勢和預(yù)測上更加主動
建立精確的生命價值周期(LTV)、地圖和用戶類型
閱讀更長和更復(fù)雜的屬性窗口(用于網(wǎng)站點擊流數(shù)據(jù))
對通過細(xì)分的更復(fù)雜的導(dǎo)航進行可視化,并且改善你的轉(zhuǎn)化漏斗(用于網(wǎng)站點擊流數(shù)據(jù))
并不適用所有人
請記住,大數(shù)據(jù)分析并不適合所有人。如果你沒有安裝并且制定分析中的目標(biāo)、沒有準(zhǔn)備好歸因模型、再營銷和高級細(xì)分,那么你就沒有為大數(shù)據(jù)做好準(zhǔn)備。
如果你把谷歌分析使用到了極限,特別是由于他的采樣數(shù)據(jù)。那么你已經(jīng)準(zhǔn)備好接觸大數(shù)據(jù)的皮毛了。
入門級大數(shù)據(jù)解決方案
目前有一大批面向企業(yè)級的大數(shù)據(jù)解決方案,比如甲骨文、SAP,、IBM、EMC和惠普。但是。這篇文章是面向?qū)ふ胰腴T級大數(shù)據(jù)解決方案的中小型企業(yè)的讀者。下面我們將討論數(shù)據(jù)分析的輸出,并且分享兩個相對廉價的解決方案,從而幫助你開始使用大數(shù)據(jù)分析。
分析結(jié)果的輸出
目前對于大多數(shù)企業(yè)而言,數(shù)據(jù)分析主要還是針對核心數(shù)據(jù)。然而在未來,數(shù)據(jù)分析將不會采用采樣數(shù)據(jù),并且會結(jié)合其他來源的數(shù)據(jù),使用更加復(fù)雜的工具(比如Tableau)去分析他。谷歌分析是一個偉大的工具,但是你能獲得的結(jié)果目前已經(jīng)到達極致了。
匯總數(shù)據(jù)的第一步往往是你輸出數(shù)據(jù)分析的過程。
如果你是一個谷歌分析高級版的用戶,這將很容易被推進。因為谷歌分析高級版集成了BigQuery功能來幫助企業(yè)推動大數(shù)據(jù)分析。(學(xué)習(xí)更多的關(guān)于數(shù)據(jù)分析及BigQuery的集成,請查看視頻)
如果你是一個谷歌分析標(biāo)準(zhǔn)版的用戶,也不用擔(dān)心。我們已經(jīng)開發(fā)了一個工具,它可以導(dǎo)出未采樣的谷歌分析數(shù)據(jù),并且把數(shù)據(jù)推送到BigQuery,或者其他的可以做大數(shù)據(jù)分析的數(shù)據(jù)倉庫或者數(shù)據(jù)工具中。
(注:你可能也注意到了其他的可以導(dǎo)出谷歌分析未采樣數(shù)據(jù)的工具,但是不同的是,這是我們的主要工作。作為一個谷歌分析工具的咨詢公司,我們不得不經(jīng)常幫助客戶導(dǎo)出未采樣的數(shù)據(jù)做報告用。但是當(dāng)我們發(fā)現(xiàn)了其他工具的一些問題時,我們不得不自己創(chuàng)建一個更可靠的解決方案。)
一旦你導(dǎo)出了你的數(shù)據(jù),你可以做好準(zhǔn)備把它導(dǎo)入到一個大數(shù)據(jù)分析工具中進行存儲、處理和可視化。這就給我們帶來了最好的入門級大數(shù)據(jù)解決方案。
谷歌大數(shù)據(jù)解決方案
谷歌BigQuery是一個網(wǎng)絡(luò)服務(wù),它能夠讓你執(zhí)行數(shù)十億行的大規(guī)模的數(shù)據(jù)集的交互分析。重要的是它很容易使用,并且允許精明的用戶根據(jù)需求開發(fā)更加大的功能。
BigQuery采用你容易承受的按需定價的原則,當(dāng)你開始存儲和處理你的大數(shù)據(jù)查詢時,每個月的花費只有幾百美金。事實上,每個月前100GB的數(shù)據(jù)處理是免費的。隨著你需求的增長,你可以拓展你的數(shù)據(jù)需求,并且為這部分需求買單。最好的消息是,BigQuery使得大數(shù)據(jù)存儲和處理適用于所有人。
Tableau大數(shù)據(jù)解決方案
Tableau提供了4個強大的功能(也許更多)來促進大數(shù)據(jù)分析和預(yù)測分析。
Salesforce連接器允許你輕松的連接CRM和銷售數(shù)據(jù)(更快、更容易的連接CRM和銷售數(shù)據(jù),所以如果你使用Salesforce,沒有什么理由不加入大數(shù)據(jù))
谷歌分析鏈接可以幫助你更容易的創(chuàng)建自定義的儀表盤和報告(然而這個功能依舊需要升級才能變的更好)
谷歌BigQuery連接器可以快速的分析在谷歌免費的網(wǎng)絡(luò)服務(wù)中的大量數(shù)據(jù)。
為任何點擊行為的分析添加預(yù)測的功能(真正快速的預(yù)測)
數(shù)據(jù)分析師是關(guān)鍵
企業(yè)想要利用大數(shù)據(jù),是需要一個數(shù)據(jù)分析師的。他必須知道不同數(shù)據(jù)的用法,并且要授予工具連接數(shù)據(jù)的權(quán)限。
當(dāng)一個數(shù)據(jù)分析師使用BigQuery或者Tableau來完成提取和合并數(shù)據(jù)時,他們可以發(fā)現(xiàn)在大型數(shù)據(jù)集合當(dāng)中的隱藏的模式。這才是大數(shù)據(jù)分析的關(guān)鍵。它可以是決策者做出更好的決策,并且加強了更精細(xì)顆粒度的數(shù)據(jù)段的識別。
利用這個新技能,你可以發(fā)現(xiàn)不同的用戶與網(wǎng)站的互動行為。你可以在谷歌分析中以此來創(chuàng)建新的高級細(xì)分規(guī)則并且針對你的市場或者網(wǎng)站活動做出更高的價值分析。
發(fā)現(xiàn)不明情況內(nèi)的價值
你的很多不同的數(shù)據(jù)隱藏不明的情況,這些是希望被發(fā)現(xiàn)并告知的。開始把網(wǎng)站分析、CRM、社交數(shù)據(jù)、位置數(shù)據(jù)等不同的數(shù)據(jù)源進行結(jié)合。這會使你的數(shù)據(jù)有了相關(guān)的背景,并且允許你通過數(shù)據(jù)看到一個更加完整的情況。這一定會讓你勝出競爭對手。
為了說明這點,我們舉個例子,通過大數(shù)據(jù)分析匯總社交數(shù)據(jù)、位置數(shù)據(jù)、客戶數(shù)據(jù)、銷售數(shù)據(jù),你可以發(fā)現(xiàn)在舊金山的社會化媒體的趨勢。這使你可以利用用戶需求的增加來增加特定地區(qū)的庫存。
不要忘了大數(shù)據(jù)分析的黃金法則:關(guān)注點,在正確的時間關(guān)注正確的商業(yè)問題。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04