
大數(shù)據(jù)用于商業(yè)決策有盲區(qū) “大數(shù)據(jù)之父”給出新對策
8月25日,舍恩伯格出席了2016IEBE上海高峰論壇,并就企業(yè)如何更好地利用大數(shù)據(jù)進行商業(yè)決策等問題接受了界面新聞的專訪。
越 來越多的企業(yè)開始重視對大數(shù)據(jù)的分析與利用。據(jù)貝恩咨詢公司的一份全球調(diào)研報告顯示,在其調(diào)研的超過400家年營業(yè)額高于5億美元的企業(yè)中,有大約60% 的企業(yè)正積極在大數(shù)據(jù)方面進行投資,以期獲取企業(yè)發(fā)展的新動力。大數(shù)據(jù)已經(jīng)從高端化、差異化的決策工具,漸漸演化為各企業(yè)常規(guī)化的決策工具。
與此同時,人們對于大數(shù)據(jù)價值的看法也在發(fā)生轉(zhuǎn)變。在大數(shù)據(jù)研究的早期,極端樂觀的態(tài)度是當時的主流,但近年來,這類觀點開始受到反思與質(zhì)疑。舍恩伯格對界面新聞記者表示,“如果對大數(shù)據(jù)解讀得過度,實際上就是濫用數(shù)據(jù)”。
研究大數(shù)據(jù),誠然可以讓企業(yè)更好地發(fā)現(xiàn)數(shù)據(jù)背后的商機,但是,把大數(shù)據(jù)運用到商業(yè)決策也存在不少局限。
以舍恩伯格之見,大數(shù)據(jù)用于商業(yè)決策存在以下三大難點。
難點一:只分析相關(guān)關(guān)系,導(dǎo)致商業(yè)決策出現(xiàn)盲區(qū)。
科研領(lǐng)域的很多統(tǒng)計和分析方法未必適合信息時代的商業(yè)領(lǐng)域,舍恩伯格對界面新聞記者說:“很多人把數(shù)據(jù)間的相關(guān)關(guān)系看成是因果關(guān)系,這有可能造成對大數(shù)據(jù)的過度解讀?!泵绹f金山游戲公司Zynga的興衰,正是這樣一個例證。
Zynga 公司的聯(lián)合創(chuàng)始人馬克·平卡斯(Mark Pincus)非常篤信大數(shù)據(jù)的力量。他在公司創(chuàng)立之初就搭建了一套完整的數(shù)據(jù)分析系統(tǒng),并組建了以谷歌公司數(shù)據(jù)分析專家領(lǐng)銜的大數(shù)據(jù)團隊。Zynga公 司在數(shù)據(jù)倉庫、A/B測試工具和大數(shù)據(jù)分析方法上的領(lǐng)先,使其較其他游戲公司而言,可以更快按用戶反饋意見調(diào)整各類決策和設(shè)置。比如,游戲中的草地到底是 設(shè)為紅色還是綠色,Zynga公司管理層不做決策,而是同時設(shè)置紅綠兩套顏色方案,哪一邊用戶付費程度高,Zynga公司就迅速把草地定調(diào)為哪種顏色。這 樣的優(yōu)勢,也確實讓Zynga公司在草創(chuàng)時期獲益良多,其最熱門的一款游戲《Farm Ville》曾創(chuàng)下月活躍用戶8300萬的紀錄。
但 時間一長,這套體系的弊端也漸漸浮現(xiàn)。這種完全按當前用戶喜好決策的模式,或許能分析游戲何以暢銷的相關(guān)因素,但無法分析游戲何以暢銷的因果因素。這使得 Zynga公司的新游戲產(chǎn)品持續(xù)產(chǎn)生同質(zhì)化迭代。公司上下從領(lǐng)導(dǎo)層到各部門員工,關(guān)注游戲商業(yè)模式創(chuàng)新者日益減少。而在競爭激烈、變化速度極快的游戲行 業(yè),失去創(chuàng)新精神就意味著全面落后。隨著Supercell公司、King公司等對手不斷推出創(chuàng)新型游戲,Zynga公司也在市值蒸發(fā)逾100億美元后, 逐漸淡出主流游戲公司陣營。
當前,商業(yè)環(huán)境的多變,令企業(yè)在做商業(yè)決策時更像是在面臨一個充滿突變的混沌系統(tǒng)。此時,基于陳舊數(shù)據(jù)、基于相關(guān)關(guān)系分析得出的結(jié)論,哪怕分析過程中數(shù)據(jù)量再大、分析方法再繁復(fù),也難保企業(yè)不走進決策的盲區(qū)。
難點二:完整的大數(shù)據(jù)難以被企業(yè)獲取。
所謂“大數(shù)據(jù)”,指的是總量的全體數(shù)據(jù)。但囿于人類在數(shù)據(jù)采集、存儲與處理等方面的種種客觀限制,要獲得這樣的數(shù)據(jù)往往難度巨大。
一方面,完整大數(shù)據(jù)的采集非常困難。舍恩伯格對界面新聞記者表示:“大數(shù)據(jù)應(yīng)用通常分為三個步驟:第一步是搜集數(shù)據(jù),第二步是分析數(shù)據(jù),第三步是根據(jù)數(shù)據(jù)分析結(jié)果做出決策。其中,對很多公司而言,最難的一點就是搜集數(shù)據(jù)?!?/span>
另 一方面,隨著數(shù)據(jù)規(guī)模變得越來越龐大,企業(yè)的大數(shù)據(jù)存儲與處理能力也在不斷受到挑戰(zhàn)。在傳統(tǒng)介質(zhì)存儲數(shù)據(jù)已愈發(fā)不現(xiàn)實的今天,商業(yè)數(shù)據(jù)的存儲往往更依賴云 儲存等方式。這樣一來,企業(yè)在添置云服務(wù)及Hadoop分布計算平臺等方面的預(yù)算,將是一筆不小支出。另外,由于完整的、結(jié)構(gòu)化的數(shù)據(jù)難以獲取,大數(shù)據(jù)在 很大程度上存在著非結(jié)構(gòu)化的特征。例如,舍恩伯格就在《大數(shù)據(jù)時代》一書中有寫道,“只有5%的數(shù)字數(shù)據(jù)是結(jié)構(gòu)化的且能適用于傳統(tǒng)數(shù)據(jù)庫”??梢?,企業(yè)在 采用智能分析、圖像識別等一系列先進算法來使大數(shù)據(jù)結(jié)構(gòu)化時,將面臨高額花費。一旦企業(yè)的相關(guān)投入跟不上,其所獲得的大數(shù)據(jù)就難言完整。
并 不足夠完整的大數(shù)據(jù),不僅不能為企業(yè)決策提供幫助,反而可能起到誤導(dǎo)的作用。在影視行業(yè),就發(fā)生過試圖利用大數(shù)據(jù)預(yù)測影片票房,結(jié)果卻與實際票房差距甚遠 的事例。比如,愛夢娛樂公司就曾利用其大數(shù)據(jù)建模,為電影《后會無期》推算了影片總票房收入,其推算結(jié)果為4.3億到4.8億元。而該影片的實際票房則突 破了6.2億元。這樣的推算結(jié)果,顯然難以幫助影業(yè)公司在產(chǎn)品宣傳、渠道建設(shè)等方面進行理性決策。事實上,愛奇藝公司CEO龔宇也曾表示,百度和愛奇藝也 有相關(guān)的大數(shù)據(jù),但因為在這些搜集到的數(shù)據(jù)中仍有涉及不到的因素,所以這類預(yù)測的準確率不算太高。由此可見,只要大數(shù)據(jù)中仍存在遺漏和偏差,其對企業(yè)潛在 的誤導(dǎo)可能性就不容忽視。
難點三:大數(shù)據(jù)分析領(lǐng)域人才短缺。
企業(yè)對大數(shù)據(jù)的運用能力,受制于其人才儲備狀況。舍恩伯格說,“在大數(shù)據(jù)領(lǐng)域的研究和發(fā)展中,最重要的是人才?!?/span>
但 因為大數(shù)據(jù)分析興起的時間并不長,且分析團隊往往規(guī)模不小,所以,即使是頂尖企業(yè)在組建大數(shù)據(jù)分析部門時也難言輕松。以Facebook公司為例,這家硅 谷巨頭花了將近四年時間,建立了一個超過30人的團隊,才搭建起Facebook自己的數(shù)據(jù)處理平臺。維持這個數(shù)據(jù)處理平臺的常規(guī)運行,更是需要超過 100名數(shù)據(jù)分析專家。又比如,LinkedIn公司建立起自己的大數(shù)據(jù)部門用了整整六年時間。
如 果這些知名公司,都需要在大數(shù)據(jù)分析部門的建設(shè)上如此費心費力,那么,其他公司在完成此任務(wù)時,其難度無疑更甚。麥肯錫咨詢公司發(fā)布的一份大數(shù)據(jù)報告就曾 預(yù)測,到2018年,僅美國在數(shù)據(jù)科學家方面的人才缺口就會達到14萬至19萬人。人員構(gòu)架的短板,則會導(dǎo)致大數(shù)據(jù)分析領(lǐng)域先進技術(shù)難以得到實施。從貝恩 咨詢公司的那份全球調(diào)研報告中可以發(fā)現(xiàn),目前僅有38%的企業(yè),能夠使用如NoSQL、HPCC以及自動數(shù)據(jù)清洗算法等大數(shù)據(jù)領(lǐng)域的先進分析方法。這些都 使得各企業(yè)在用大數(shù)據(jù)幫助企業(yè)決策時,其效果需要打上一個不小的問號。
縮小決策范圍,才能放大大數(shù)據(jù)的作用
在運用大數(shù)據(jù)來輔助企業(yè)決策方面,舍恩伯格認為亞馬遜是個典型案例。
對 于用戶在亞馬遜網(wǎng)站上的頁面停留時間、評論查看情況、各類關(guān)鍵詞的搜索、各種商品的瀏覽量等大數(shù)據(jù),亞馬遜公司都會做出細致分析。這家在各個業(yè)務(wù)環(huán)節(jié)中都 無不體現(xiàn)著“數(shù)據(jù)驅(qū)動”的公司,也在2016年《財富》全球500強排行榜中躋身前50強,排名達到第44位。誠如舍恩伯格所言,“那些能夠理解大數(shù)據(jù)、 并且懂得讓大數(shù)據(jù)提供價值的公司,將能夠有更多的成功可能性?!?/span>
大數(shù)據(jù)能讓商業(yè)決策變得更盲目,還是更理性?舍恩伯格認為關(guān)鍵還是在于,企業(yè)是否對大數(shù)據(jù)的運用范圍進行了縮小,為其樹立一些邊界。
即使是非常重視大數(shù)據(jù)力量的亞馬遜公司,其在推出Prime等前瞻性業(yè)務(wù)時,主要依靠的也不是某些大數(shù)據(jù),而是該公司創(chuàng)始人杰夫·貝佐斯(Jeff Bezos)的經(jīng)營哲學與商業(yè)洞見。
舍恩伯格向界面新聞記者說:“大數(shù)據(jù)是一種資源和工具,它的目的應(yīng)限定為告知,而不是解釋?!卑选案嬷钡娜蝿?wù)交給大數(shù)據(jù),而把“解釋”的權(quán)利保留在人的手中,才是讓大數(shù)據(jù)參與企業(yè)商業(yè)決策的良好方法。大數(shù)據(jù)的真正魅力,恰恰產(chǎn)生于其變“小”之后。
這樣,大數(shù)據(jù)在釋放用戶信息、改進商業(yè)建模、優(yōu)化決策精細程度等方面的優(yōu)勢,將得到保留。與此同時,管理者也能利用大數(shù)據(jù)提供的精準量化分析成果,使自己在戰(zhàn)略遠見與商業(yè)洞察方面的優(yōu)勢獲得更強有力的支撐。
今年3月,谷歌公司旗下的AlphaGo以4:1的總比分戰(zhàn)勝世界圍棋冠軍李世石,引起了巨大轟動。正如舍恩伯格所述,“現(xiàn)代的人工智能,其進行自我深度學習的根基就是大數(shù)據(jù)”,AlphaGo,正是人類對大數(shù)據(jù)決策能力的一次良好運用。
微縮于19X19格的圍棋規(guī)則邊界后,AlphaGo運用大數(shù)據(jù)完成了遠比人類更高明的決策,給予世人以啟示。
在舍恩伯格看來,“人類要知曉大數(shù)據(jù)的力量,同時也要看到大數(shù)據(jù)的局限”。在未來,一個個有邊界限定的“棋盤”,或許才是大數(shù)據(jù)在商業(yè)決策時更好的用武之地。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10