
脫掉大數(shù)據(jù)外衣 走出大數(shù)據(jù)困境 _數(shù)據(jù)分析師
如果要評選最近兩年出現(xiàn)在媒體上的十大熱詞,大數(shù)據(jù)毫無意外會入選其中。
然而,似乎所有人都意識到大數(shù)據(jù)的能力,但卻找不到運用大數(shù)據(jù)的方法。不管是企業(yè)、政府或者其他社團組織,大數(shù)據(jù)離他們那么近,卻那么遠。
大數(shù)據(jù)成了人們競相議論的熱詞,但鮮有人提及這場巨大變革中人們需要具備的能力,無數(shù)的企業(yè)及個人忘‘數(shù)’興嘆。
作為阿里巴巴集團商業(yè)智能部副總裁、國內(nèi)大數(shù)據(jù)實踐的先行者和數(shù)據(jù)觀察家,擁有十幾年豐富的數(shù)據(jù)實戰(zhàn)經(jīng)驗的車品覺,或許是國內(nèi)對于如何利用大數(shù)據(jù)這個問題最有話語權的那個人。
未來是大數(shù)據(jù)的時代,未來的競爭就是數(shù)據(jù)的競爭,也許,我們早該忘掉那些華而不實的喧囂,讓大數(shù)據(jù)真正從‘看’到‘用’,真正地活起來。
為了能讓更多的人學會怎么用大數(shù)據(jù),車品覺寫作了《決戰(zhàn)大數(shù)據(jù)》一書。在該書中,他試圖呈現(xiàn)出自己所理解的大數(shù)據(jù)的本質以及如何才能讓企業(yè)走出用大數(shù)據(jù)的困境。
作為一個跟數(shù)據(jù)打了十幾年交道的人,我深深地知道,從‘看’到‘用’,再從‘用’到‘養(yǎng)’運營數(shù)據(jù),本身就是一個復雜的過程。目前我們最應該做的,就是暫且忘記大數(shù)據(jù)的概念。
我希望從一個實用的角度來撥開大數(shù)據(jù)的‘迷霧’,告訴每個人大數(shù)據(jù)的具體運作應該是什么樣的;我們要的不是數(shù)據(jù)的量,而是有‘質’的量,這正是我寫作本書的重要目的。
脫掉大數(shù)據(jù)外衣
研究、實踐大數(shù)據(jù)多年的車品覺,對于大數(shù)據(jù)有著自己獨特的看法。在他看來,大數(shù)據(jù)就像是國王的新衣:每個人都在說著動聽的話,卻沒有人看到那件衣服。
網(wǎng)絡上有很多人在談大數(shù)據(jù),但是他們只會談,不會做。那些所謂的大數(shù)據(jù)專家,根本就沒有做過。
對于為何沒有好的辦法去做,車品覺《決戰(zhàn)大數(shù)據(jù)》一書稱:用數(shù)據(jù)的人不知道大數(shù)據(jù)從哪里來,做數(shù)據(jù)的人不知道大數(shù)據(jù)如何用。
用的人不敢用,因為大數(shù)據(jù)的真實性;做的人不知道怎么用,因為大數(shù)據(jù)的復雜性。這一問題造成的結果就是,數(shù)據(jù)量變得越來越大,而且越來越無法有效地被使用。
大數(shù)據(jù)從來不是免費的午餐,伴隨著大數(shù)據(jù)熱潮的到來,關于大數(shù)據(jù)的一些問題也會層出不窮大數(shù)據(jù)會夾雜著虛假信息;大數(shù)據(jù)的來源是多種渠道的,偏倚、隨機的誤差總是存在
除了上述問題,人才的斷層,才是大數(shù)據(jù)所面臨的最嚴重的問題。
現(xiàn)在,收集數(shù)據(jù)的人并不清楚未來使用數(shù)據(jù)的人要做什么,這是目前大數(shù)據(jù)的一大命門。
車品覺解釋,在使用大數(shù)據(jù)時,我們通常的做法是先把數(shù)據(jù)收集起來,因為這些數(shù)據(jù)在未來可能有用。不過,未來可能有用就注定會引發(fā)一個問題收集數(shù)據(jù)的人不知道未來使用數(shù)據(jù)的人要做什么。
這時候,如果你再問收集數(shù)據(jù)的人如何才能更好地收集數(shù)據(jù),那么,數(shù)據(jù)的使用就會陷入一個死循環(huán)。
在書中,車品覺舉了搜索感冒藥的例子,來佐證自己的這一論斷,他寫道:比如我在搜索引擎里面發(fā)現(xiàn)某個地方搜索感冒藥的頻率非常高,于是,我就斷定這個地方可能出現(xiàn)了流行性感冒。但是,這樣是否就是正確地使用大數(shù)據(jù)呢?
答案是否定的。因此,車品覺說,生產(chǎn)數(shù)據(jù)的人,并沒有給使用者這個數(shù)據(jù)的人一些參數(shù),而使用者在其使用之后如果效果不好,就會面臨損失。而這樣的信息不對稱,最終受到損害的是那些使用數(shù)據(jù)的人。
問題就是答案
在車品覺看來,企業(yè)如果想要真正用好大數(shù)據(jù),需要看清楚大數(shù)據(jù)能給企業(yè)帶來怎樣的價值,以及它的本質到底是什么。
當回歸到這個問題時,如果你自己都沒有弄清楚,那么就算給你再多的數(shù)據(jù),你也只會手足無措。
那么,大數(shù)據(jù)究竟能給企業(yè)帶來怎樣的價值呢?大數(shù)據(jù)的本質又是什么呢?在《決戰(zhàn)大數(shù)據(jù)》一書中,車品覺給出了自己的理解:大數(shù)據(jù)能讓企業(yè)合理地分配資源,以及帶來更好的用戶體驗,而大數(shù)據(jù)的本質則在于還原用戶的真實需求。
數(shù)據(jù)收集實現(xiàn)的是企業(yè)資源的合理分配,例如,把推薦系統(tǒng)做得更好,讓更多的用戶可以有更高的概率找到他們想要的商品,這樣就能提高商品的購買率,為企業(yè)創(chuàng)造更大的經(jīng)濟效益;數(shù)據(jù)收集實現(xiàn)的也是顧客體驗的提升,例如,便捷的搜索引擎可以使顧客更容易地找到他們所需要的商品,為他們創(chuàng)造更加優(yōu)質的購物體驗。
而關于大數(shù)據(jù)本質的判斷,車品覺則在書中作出了如下論斷:數(shù)據(jù)的本質就是還原,這是收集元數(shù)據(jù)的關鍵方法,如果沒有這個概念,你就不知道未來你需要什么數(shù)據(jù),就更不懂得什么是重要的數(shù)據(jù),到最后只會產(chǎn)生越來越多的無從辨別的數(shù)據(jù)。
在車品覺看來,數(shù)據(jù)的這一還原功能,就像是一個瞄準器,瞄準消費者的購物行為,并且以數(shù)據(jù)的形式記錄下來。
如何更好地理解用戶在各個不同場景下表現(xiàn)出來的不同需求,如何更好地理解數(shù)據(jù)融合后產(chǎn)生的價值,將是未來商業(yè)中每一個企業(yè)都必須考慮的問題。
阿里巴巴的秘訣
作為阿里巴巴集團副總裁和數(shù)據(jù)委員會會長,車品覺是少數(shù)幾個對阿里巴巴從IT戰(zhàn)略轉型到DT戰(zhàn)略(大數(shù)據(jù)戰(zhàn)略)享有發(fā)言權的人之一。在《決戰(zhàn)大數(shù)據(jù)》一書中,他總結了阿里巴巴在踐行DT戰(zhàn)略中的經(jīng)驗分享給后來者。
當談到阿里巴巴的數(shù)據(jù)化運營時,我首先想到的就是‘人’,我們太多的時間都在討論我們應該做什么,卻很少會反過來想如果讓數(shù)據(jù)化運營落地首先要從‘人’做起。
因此,在《決戰(zhàn)大數(shù)據(jù)》一書中,車品覺首先跟讀者分享的,便是阿里巴巴數(shù)據(jù)化運營的內(nèi)功混、通、曬這三板斧。
所謂的混,是指數(shù)據(jù)分析師要跟管理業(yè)務部門的人打成一片。車品覺認為,作為數(shù)據(jù)分析師,如果不和業(yè)務部門混在一起,就不會知道業(yè)務部門在做什么,商業(yè)敏感是要靠‘混’出來的,它并不會憑空出現(xiàn)在你的面前。
只有具備商業(yè)敏感的數(shù)據(jù)分析師,才會懂得使用什么數(shù)據(jù)來驅動公司實現(xiàn)經(jīng)營目標,現(xiàn)在在公司里,我最不希望看到數(shù)據(jù)分析師長時間坐在自己的位置上埋頭苦干,我更愿意看到他們和業(yè)務人員混成一片。
而車品覺所謂的通,則是指企業(yè)判斷數(shù)據(jù)是否有價值的一種能力,如果做到了這一點,就做到了通。
堅持帶著業(yè)務問題來觀察數(shù)據(jù)或者帶著數(shù)據(jù)來觀察業(yè)務,兼?zhèn)涠叩拿舾校褪亲龅搅恕ā?,有些人在很短的時間里就能判斷出數(shù)據(jù)是否有價值,就是因為‘混通’了。
但是,想要打通數(shù)據(jù),并不容易。在書中,車品覺提出了打通數(shù)據(jù)的三個關鍵點:首先是要做好數(shù)據(jù)安全工作,以保證公司內(nèi)部不同職位的員工可以查看不同的數(shù)據(jù);然后,統(tǒng)一不同部門的數(shù)據(jù)標準,使公司內(nèi)部數(shù)據(jù)有統(tǒng)一的接口,避免混亂;最后,關聯(lián)不同部門的數(shù)據(jù),創(chuàng)造機會讓數(shù)據(jù)的運營可以擴散至部門之外。
在打通數(shù)據(jù)之后,阿里巴巴所做的便是曬數(shù)據(jù)。在‘曬’數(shù)據(jù)層面上,通常是通過數(shù)據(jù)來回答這幾個問題:業(yè)務好還是不好;數(shù)據(jù)如何改變可以讓業(yè)務更好;如何利用數(shù)據(jù)幫助業(yè)務發(fā)現(xiàn)機會,甚至產(chǎn)生出新的商業(yè)價值。
混、通、曬這三板斧,是阿里巴巴在實施大數(shù)據(jù)戰(zhàn)略時的核心法寶,車品覺說:它們其實是配合了數(shù)據(jù)方法論與人的修煉,能做到借事修人,讓用數(shù)據(jù)的人在數(shù)據(jù)中成長,循序漸進地讓每個人成為數(shù)據(jù)分析師。
當然,這三板斧只是阿里巴巴大數(shù)據(jù)戰(zhàn)略的內(nèi)核部分。在書中,車品覺還提到了實施大數(shù)據(jù)戰(zhàn)略所需要的外延策略,而要了解大數(shù)據(jù)的最佳實現(xiàn)方式,無疑是直接閱讀他所撰寫的《決戰(zhàn)大數(shù)據(jù)》一書。
數(shù)據(jù)的5大價值
01.識別和串聯(lián)價值
能夠辨別關系和身份的數(shù)據(jù)是最重要的,這些數(shù)據(jù)應該是有多少存多少,永遠不要放棄。在大數(shù)據(jù)時代,越能夠還原用戶真實身份和真實行為的數(shù)據(jù),就越能夠讓企業(yè)在大數(shù)據(jù)競爭中保持戰(zhàn)略優(yōu)勢。
02.描述價值
描述業(yè)務的數(shù)據(jù)包括成交額、成交用戶數(shù)、網(wǎng)站的流量、網(wǎng)站詳細頁的流量、成交的賣家數(shù)等等,我們可以通過數(shù)據(jù)對業(yè)務的描述來觀察交易活動是否正常。
03.時間價值
數(shù)據(jù)的時間價值是大數(shù)據(jù)運用最直接的體現(xiàn),通過對時間的分析,能夠很好地歸納出一個用戶對于一種場景的偏好。
04.預測價值
數(shù)據(jù)的預測價值分成兩個部分,第一是對于某一個單品進行預測,第二是數(shù)據(jù)對于經(jīng)營狀況的預測,即對公司的整體經(jīng)營進行預測,并能夠用預測的結論指導公司的經(jīng)營策略。
05.產(chǎn)出數(shù)據(jù)的價值
從數(shù)據(jù)的價值來說,很多數(shù)據(jù)本身并沒有特別的含義,但是在幾個數(shù)據(jù)組合在一起或者對部分數(shù)據(jù)進行整合之后,就產(chǎn)生了新的價值。文章來自:CDA數(shù)據(jù)分析師培訓官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03