
阿里巴巴分析企業(yè)如何利用大數據解決問題
從以前必須求老板看看他做的數據,到現在老板會挑剔他準備的數據沒有用,他認為,這是企業(yè)利用數據進化的結果,他發(fā)現美國許多企業(yè)不只擁有數據科學家,甚至還多了決策科學家,負責用數據替公司確定決策。
市值全球第2名的阿里巴巴,旗下諸多服務包括阿里巴巴B2B平臺、淘寶網C2C平臺、天貓商城B2C平臺,還有全國最大的第三方支付平臺支付寶等, 而這些服務所產生的數據全歸一個人管,他就是阿里巴巴數據技術及產品部副總裁車品覺。
車品覺以8年打滾于數據界的經驗,以及在阿里巴巴實務應用下發(fā)展出「數據10誡」,現已修正到了4.0版本。作為阿里巴巴集團的數據最高領導人,車品覺說,他是虔誠的數據信仰者,喜歡用數據做決策解決問題。
企業(yè)要用數據解決問題,首先要履行數據10誡的第一條,清楚定義欲分析解決的問題是什么?車品覺舉例,現在中國各大都市都極力發(fā)展智慧城市,但是對于城市來說,什么樣的建設或是應用才能稱為智慧,他說,如果沒有定義智慧城市,那就難以衡量專案的成效,「定義問題是從知道到不知道的過程?!?/span>
雖然數據科學議題很熱,企業(yè)有許多問題都能從數據中找出答案,但也「不是每一個問題都是數據的問題,不是每一個問題都是大數據的問題?!管嚻酚X說,要知道該問題是否能靠數據解決,必須先思考5件事,以明確了解需要解決的問題,「這是什么問題?誰的問題?這問題你來解決嗎?需要現在解決嗎?數據能解決嗎?」當這5個問題的答案皆為是,那或許就是當下可以靠數據解決的問題。
阿里巴巴大數據心法:數據10誡 4.0版
1. 一切從定義「問題」開始,已知到未知的過程
2. 先假設數據都能獲取來思考問題,包括衍生及循環(huán)思考
3. 讓數據來幫助描述、診斷、預測以及行動建議
4.「快+準」的數據能從已知規(guī)律中產生價值
5.「廣+亂」的數據能從發(fā)現中顛覆已知
6. 大數據不是獨奏,而是不斷連接無處不在的資料
7. 大數據技術就是加速和累積「數據、分析與服務」的能力
8. 數據生態(tài)的連接需要建立標準與規(guī)范
9. 大數據是來自很多小數據的組合
10. 數據是一種信仰!
然而不少企業(yè)知道要解決的問題,卻苦無解決問題的數據,車品覺認為,思考問題解法時,不能把沒有數據當作借口,因為現在可以取得數據的方式太多了。車品覺舉例,調查研討會的品質可以用最傳統(tǒng)的問卷,也能用科技的方法解決,只要在場內跟場外架設手機探測器掃描會眾手機ID,便能記錄會眾進出場內外的狀況,進一步分析演講品質。清楚定義分析的問題,不怕沒數據。
車品覺另外舉了「快的打車」App的例子,他們想解決司機拒載乘客的問題,因此提供了評價的機制,當司機拒載的時候乘客得以反應,而這些評價數據也是在思考想解決的問題后才出現。所以「只要問題定義好, 需要的數據都存在,思考應該凌駕在數據技術之上,思考方法才是產生價值最重要的一點?!?/span>
因此數據并非不存在,重點在于企業(yè)能否周全收集數據,為了更清楚理解數據,歸納不同類型數據能發(fā)揮長處的時機,他用不同面向剖析數據。
首先,車品覺以能否預料以及意見正反作為X與Y軸,畫出四大象限描述企業(yè)所收集的數據。他舉例,餐廳紀錄客人的餐點,這是收集Expect Positive(預料中的正面)的數據,而Expect Negative(預料中的反面)的例子則是客人沒吃完餐點的紀錄。另一個電子商務例子則是,當有人到周大福買珠寶,記錄了客戶買了哪一個商品,這就是Expect Positive的紀錄,而調查客戶看了哪5個商品才買到了想要的戒指,則是Expect Negative,車品覺說,Expect Negative對于機器學習是重要的訓練樣本。
另外,他也依可用性將數據分為「快+準」和「廣+亂」2類?!缚欤珳省沟臄祿悄切┢髽I(yè)能很快速地取得,或是經常性使用的數據,能從已知的規(guī)律中產生價值,能做的改善是加速數據更新的頻率,抑或是加速數據整合的速度,以更快速的做出決策,或許過去須3小時才更新數據,改進后期望能進步到即時。他認為,「快+準」的數據要思考的議題是「有沒有、準不準、細不細、全不全、穩(wěn)不穩(wěn)以及快不快?!?/span>
相對于「快+準」則是「廣+亂」,「廣+亂」的數據就是現今稱作大數據的類型,來源廣泛且格式多元,特性是能從發(fā)現中顛覆已知,車品覺認為,從「廣+亂」的數據中,才能發(fā)現意料之外的事情,因此從這些數據提煉出來的信息也比較有明顯價值。
能有意料之外的發(fā)現,正是數據的價值,品覺認為,大部分人思考方法是演繹法形式,從已知推論未知,但是運用大數據技術可以逆轉這個程序。他以營銷作為例子,過去一項產品的營銷,企業(yè)會主動設定目標人群,比如是三十幾歲的女性等,針對這群人投放廣告,但是現在的方法,可以透過歷史的銷售數據,找出購買行為的特征,逆向圈出目標人群。
車品覺也用時間維度分析數據特性,不同周期的數據所提供的價值也不一樣,以天為周期的數據可以描述狀況,而1周需要知道的則是,上星期做的決策是正確還是錯誤的,1個月就必須了解競爭對手的策略與狀態(tài),1季就需要檢討組織是否達到設定的KPI。
阿里巴巴使用數據最大的分水嶺在于「從看到用」,從數據用來分析現象,到用于控制全自動化的設備上。車品覺分享前些日子所做的工作,正是以自動化無人機器取代一整個既有的部門,他說,在那個時候他領悟到,數據的目的直接影響對數據品質的要求,因為用于分析觀察還是實際使用,需要的數據屬于不同等級。
他提到,像是無人機器的動作控制,需要多個復雜模型交互作用,而穩(wěn)定且充足的數據來源是必要條件,在他們找出實際可用數據的過程,發(fā)現有很多數據的基本功沒扎穩(wěn),像是數據須達高可用性等項目,需要一塊一塊的補上。
而當企業(yè)達到沒有數據就無法提供服務的狀態(tài),就如同無人機器沒有足夠的數據就無法運作,車品覺認為,「此時企業(yè)就走在對的道路上」。也因為數據的重要性提升,企業(yè)看待數據中斷應該要等同于IT系統(tǒng)錯誤一樣的嚴重,一旦數據出錯就必須有人負責。
不只是無人機器的控制需要有非常完整的數據,在很多情境下,當沒有完整的數據描述事件發(fā)生的細節(jié),企業(yè)往往會把事件原因歸于運氣。在零售業(yè)中,顧客的購物欲望可能起始于朋友推薦,經過了商品搜尋以及品牌官網收集信息,顧客逛了電子商務網站,最后卻在大賣場購買,這樣的過程或許看似大賣場比較幸運最后成功銷售商品給這位顧客,但其實不然,過程中有許多企業(yè)應該要知道的數據。像是顧客信用卡的還款時間,因為要繳交信用卡的費用感到心痛,因此購物欲望下降,此時要顧客消費是困難重重,這雖然只是一項小數據,卻也是整個顧客購物鏈很重要的一環(huán),車品覺認為,企業(yè)應該檢視所收集的數據是否完整,因為企業(yè)忽略顧客的數據,有時候對結果影響很大。
「大數據是一種能力,企業(yè)要有愛因斯坦的大腦以及健壯的身體」,大數據能力組成的因素有思想、血液以及骨骼,思想就是數據運算邏輯或模型等,血液則是企業(yè)的數據,而骨骼便是最基礎的硬件設備。
從以前必須求老板看看他做的數據,到現在老板會挑剔他準備的數據沒有用,他認為,這是企業(yè)利用數據進化的結果,他發(fā)現美國許多企業(yè)不只擁有數據科學家,甚至還多了決策科學家,負責用數據替公司確定決策。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數據操作的 “后悔藥” 指南? 在數據庫操作中,誤刪數據、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14如何考取數據分析師證書:以 CDA 為例? ? 在數字化浪潮席卷各行各業(yè)的當下,數據分析師已然成為企業(yè)挖掘數據價值、驅動決策的 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數據分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數據科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07