
企業(yè)數據的秘密:大數據時代商業(yè)規(guī)則(一)
如今的商業(yè)世界,已經變成了飄浮在數據海洋上的巨輪。在這樣一個時代,任何人都必須用數據來說話。而那些通過數據能力駛入藍海的企業(yè),將會贏得豐厚的回報。
我們的未來能否被預測?
在澳大利亞被發(fā)現之前,生活在十七世紀歐洲的人們都相信一件事:所有的天鵝都是白色的。因為當時所能見到的天鵝的確都是白色的,所以根據經驗,那簡直就是一個真理,至少可以算是一個公理吧。那么,見到黑色天鵝的概率是多少呢?根本無法計算,也沒有人想過要計算。直到1697年,探險家在澳大利亞發(fā)現了黑天鵝,人們才知道以前的結論是片面的。
這證明了我們的認知是多么局限:雖然你是在觀察了幾百萬只天鵝之后才得出了“所有的天鵝都是白色的”結論,但只需要另一個發(fā)現就能將它徹底推翻——2007年,全球最具影響力的商業(yè)思想家塔勒布用一本《黑天鵝》幾乎讓世人絕望:我們總是以為自己知道得很多,能夠預測未來,但一次極端事件,就足以影響整個歷史的走勢。
我們的未來真的不可能被預測嗎?
每一天,我們的電子郵件都保存在電郵供應商的日志文件中;我們的通話記錄都被加上時間標記備份在電話公司的大容量硬盤上;我們何時何地買了什么東西,我們的喜好、品味以及支付能力都被信用卡提供商編目歸檔;我們的所有個人網頁、空間、微博、即時通訊文件,還有博客信息,都被保存在多個服務器上;我們的即時行蹤完全被手機供應商掌握;我們的容貌和穿著打扮都被安裝在各大商場和街角的攝像頭捕捉并記錄……
我們通常不太在意,但我們的生活完全能被這些如雨后春筍般出現的數據庫所記錄的信息串聯(lián)起來。馬克·吐溫曾說,歷史不會重演,卻自有其韻律。雖然萬事皆顯出自發(fā)偶然之態(tài),但實際上,它遠比你想象中的容易預測。
進而,全球復雜網絡權威巴拉巴西通過研究大膽地認為,93%的人類行為是可以預測的。
這是另一種顛覆性的結論。用巴拉巴西的話來說,當我們將生活數字化、公式化以及模型化的時候,我們會發(fā)現其實大家都非常相似。生活如此抵觸隨機運動,渴望朝更安全、更規(guī)則的方向發(fā)展。人類行為看上去很隨意、很偶然,卻極其容易被預測。
如果真有93%的人類行為可以被預測,這還意味著,我們的商業(yè)行為同樣可以進入可掌控的范圍——而這,就是企業(yè)數據里的秘密。
綜述:大數據時代的商業(yè)規(guī)則
胡適說中國人習慣于“差不多先生”,凡事馬馬虎虎、不求精確。歷史學家黃仁宇先生則認為,中國不懂得用數字來管理國家。而現代化社會最明顯的標志就是,它能夠將整個社會用數字管理。
事實上,如今的商業(yè)世界,已經變成了飄浮在數據海洋上的巨輪。在這樣一個時代,任何人都必須用數據來說話。而那些通過數據能力駛入藍海的企業(yè),將會贏得豐厚的回報。
數據井噴
5月18日,臉譜網(Facebook)在美IPO上市。在所有交易完成之前,幾乎沒有人敢說自己有把握去預測它上市當天股價的走勢,但一家社交媒體監(jiān)測平臺卻奇跡般地做到了。
這家監(jiān)測平臺監(jiān)測了臉譜IPO當天推特(Twitter)上的情感傾向與臉譜股價波動的關聯(lián)。例如,在開盤前推特上的情感逐漸轉向負面,25分鐘之后,臉譜的股價便開始下跌;而當推特上的情感轉向正面時,其股價在8分鐘之后也開始了回彈;當股市接近收盤時,推特上的情感轉向負面,10分鐘后股價又開始下跌。
最終的結論是,推特上每一次情感傾向的轉向都會影響臉譜網股價的波動,延遲情況只有幾分鐘到20多分鐘。
這僅僅只是基于社交網絡產生的大數據進行“預見未來”的眾多案例之一,事實上“大數據”所能帶來的巨大商業(yè)價值,已經被人認為將引領一場足以匹敵20世紀計算機革命的巨大變革。
由古至今,從未有一個時代出現過如此大規(guī)模的數據爆炸。2010年,全球企業(yè)一年新存儲的數據就超過了7000拍字節(jié),全球消費者新存儲的數據約為6000拍字節(jié),這相當于十多萬個美國國會圖書館的藏書量。
而在2006年,全世界的電子數據存儲量還僅為18萬拍字節(jié),如今這個數字已經達到180萬拍字節(jié),短短五六年間就已經增長了一個數量級。根據預測,2015年這個數字甚至會達到天文數字般的800萬拍字節(jié)。
就在此時此刻,海量數據正在源源不斷地產生。每一天,無數的數據被搜集,從不停息。“過去3年里產生的數據量,比以往4萬年的總和還要多,大數據時代的來臨已經毋庸置疑。我們即將面臨一場變革,新興大數據將成為企業(yè)發(fā)展的當務之急,而常規(guī)技術已經難以應對拍字節(jié)級的大規(guī)模數據量。這一變化所帶來的挑戰(zhàn),是成功的企業(yè)在未來發(fā)展過程中必須要面對的。只有那些能夠運用這些新數據形態(tài)的企業(yè),方能打造可持續(xù)的重要競爭優(yōu)勢?!泵绹鴬W巴馬總統(tǒng)委員會的科學技術顧問、天睿(Teradata)公司首席技術官斯蒂芬如此總結。
數據生產力
什么樣的男人更容易找到老婆?
百合網研究規(guī)劃部李琦曾經對百合網上海量注冊用戶的頭像信息進行分析,發(fā)現那些受歡迎頭像照片不僅與照片主人的長相有關,同時照片上人物的表情、臉部比例、清晰度等因素也在很大程度上決定了照片主人受歡迎的程度。而那些臉部比例占照片1/2、穿著正式、眼神直視沒有多余姿勢的男性,更容易成為婚戀網站上的寵兒。
作為一家婚戀網站,百合網不僅需要經常做一些研究報告,分析注冊用戶的年齡、地域、學歷、經濟收入等數據,即便是每名注冊用戶小小的頭像照片,背后也大有挖掘的價值。
讓我們再放眼世界,全球市值最大的連鎖餐飲企業(yè)麥當勞、零售業(yè)中的巨無霸沃爾瑪、在線零售巨頭亞馬遜,這個時代最炙手可熱的三家企業(yè),如果說它們之間存在著什么相關性的話,會是什么呢?沒錯,數據。
麥當勞的強大在于它賣的不僅僅是漢堡,而是在從事一個精準選址,對數據深入挖掘的“房地產生意”。而另一家早已認識到數據對創(chuàng)造優(yōu)勢的重要性,而且每年因此獲得了超過預期的增長公司,則是亞馬遜。它能夠利用獨有的客戶交易數據推動定制化產品的銷售和定價決策,而且其產品線的廣度前所未有。這就是亞馬遜一直以來能與無數零售商和電子零售商展開激烈競爭的關鍵優(yōu)勢所在。
沃爾瑪更是最早通過利用大數據而受益的企業(yè)之一。其一度擁有世界上最大的數據倉庫系統(tǒng),通過對消費者的購物行為等數據進行分析,沃爾瑪成為最了解顧客購物習慣的零售商,并創(chuàng)造了“啤酒與尿布”的經典商業(yè)案例。2007年,沃爾瑪建立了一個超大的數據中心,其存儲能力高達4拍字節(jié)以上。《經濟學人》在2010年的一篇報道中指出,沃爾瑪的數據量已經是美國國會圖書館的167倍。
而早在1969年,沃爾瑪就開始使用計算機來跟蹤存貨,1974年就將其分銷中心與各家商場運用計算機進行庫存控制。1983年,沃爾瑪所有門店都開始采用條形碼掃描系統(tǒng)。1987年,沃爾瑪完成了公司內部的衛(wèi)星系統(tǒng)安裝,該系統(tǒng)使得總部、分銷中心和各個商場之間可以實現實時、雙向的數據和聲音傳輸。
采用這些在當時還是小眾和超前的信息技術來搜集運營數據,為沃爾瑪最近20年的崛起打下了堅實的地基。如今,在沃爾瑪全世界最大的數據倉庫中存儲著數千家連鎖店在65周內每一筆銷售的詳細記錄,這使得業(yè)務人員可以通過分析購買行為更加了解他們的客戶。
實際上,各個行業(yè)都出現了以數據分析為競爭形式的企業(yè)。這些企業(yè)當中,既有網絡時代的新秀,如谷歌,也有經營了百年的品牌,如寶潔。它們都在數據分析的基礎上與其他企業(yè)展開競爭,同時又都是行業(yè)中的佼佼者。這兩個特點是相互聯(lián)系的,也就是說,正是因為這些公司大規(guī)模地采用了數據分析的方法,它們才成為行業(yè)中的領先者。
開啟新商業(yè)時代的鑰匙
數據已經如一股“洪流”注入了世界經濟,成為全球各個經濟領域的重要組成部分。麥肯錫公司預計,數據將與企業(yè)的固定資產和人力資源一樣,成為生產過程中的基本要素。而在今年年初的瑞士達沃斯論壇上,一份題為《大數據,大影響》的報告同樣認為,數據已經成為一種新的經濟資產類別,就像貨幣或黃金一樣。
這是大數據時代的獨特現象。和其他的生產要素相比,數據無疑又具備更獨特的特點。例如,工業(yè)生產過程中的原材料,一般都有排他性,但數據很容易實現共享,而且使用的人越多,其價值越大;數據也不像機器、廠房,會隨著使用次數的增多而貶值,相反,重復使用反而可能使它增值。此外,此數據和彼數據如果能有機地結合到一起,可能就會產生新的信息和知識,并且實現大幅增值。
麥肯錫的報告繼而指出:“已經有越來越多令人信服的證據表明:大數據將成為競爭的關鍵性基礎,并成為下一波生產率提高、創(chuàng)新和為消費者創(chuàng)造價值的支柱?!?/span>
顯然,數據的重要性已經提升到競爭性要素的高度。眾所周知,信息時代的競爭,不是勞動生產率的競爭,而是知識生產率的競爭。數據是信息的載體,是知識的源泉,當然也就可以創(chuàng)造價值和利潤。
可以預見,基于知識的競爭,將集中表現為基于數據的競爭。而這種數據競爭,將成為經濟發(fā)展的必然。
美國信息經濟領域的著名教授托馬斯·達文波特認為,隨著全球競爭的不斷深化,企業(yè)的地理優(yōu)勢也將淡化,各種國家和地區(qū)性的保護措施也將逐步取消,一項專利很快會被模仿、復制、推廣,創(chuàng)新將越來越艱難。但在除去這些要素之外,還有一點可以構成企業(yè)競爭的基礎,那就是以“低成本、高效率”的方式來開展公司的業(yè)務。這種競爭,要求公司制定流線型的商業(yè)過程,各個過程之間必須無縫隙、無摩擦地對接,并保證每一個商業(yè)決策明智、正確,在競爭的過程中不犯錯誤。
而要做到這些,企業(yè)必須廣泛推行以事實為基礎的決策方法,大量使用數據分析來優(yōu)化企業(yè)的各個運營環(huán)節(jié),通過基于數據的優(yōu)化和對接,把業(yè)務流程和覺得過程當中存在的每一分潛在的價值都擠出來,從而節(jié)約成本,戰(zhàn)勝對手,在市場上幸存。
達文波特認為,能夠始終保證自己以“數據最優(yōu)”的方式運營的公司,將會在競爭中堅持到最后。因為,粗放型經營的公司最終將因“高成本”而自動出局。
事實上,這種以數據分析為競爭能力的公司都是各自領域的領袖,他們都把自己的成功歸功于對數據分析的嫻熟應用。全球性的競爭正在變得更加激烈,這加劇了這種需要。而在西方發(fā)達國家的公司看來,和中國、印度的競爭對手相比,他們無法在產品成本方面獲得優(yōu)勢,但其最大優(yōu)勢就是能在商業(yè)過程的優(yōu)化方面不戰(zhàn)而勝。
案例:會員數據分析
顧客的消費習慣與需求,向來是零售商最重視的信息。如果你比競爭對手更早更準確地捕捉到這些信息,就可能占得先機。
塔吉特:比父親更早知道女兒懷孕
曾經有一位男性顧客到一家塔吉特店中投訴,商店竟然給他還在讀書的女兒寄嬰兒用品的優(yōu)惠券。這家全美第二大零售商,會搞出如此大的烏龍?但經過這位父親與女兒進一步溝通,才發(fā)現自己女兒真的已經懷孕了。
一家零售商是如何比一位女孩的親生父親更早得知其懷孕消息的呢?每位顧客初次到塔吉特刷卡消費時,都會獲得一組顧客識別編號,內含顧客姓名、信用卡卡號及電子郵件等個人資料。日后凡是顧客在塔吉特消費,計算機系統(tǒng)就會自動記錄消費內容、時間等信息。再加上從其他管道取得的統(tǒng)計資料,塔吉特便能形成一個龐大數據庫,運用于分析顧客喜好與需求。
塔吉特的統(tǒng)計師們通過對孕婦的消費習慣進行一次次的測試和數據分析,得出了一些非常有用的結論:孕婦在懷孕頭三個月過后會購買大量無味的潤膚露;有時在頭20周,孕婦會補充如鈣、鎂、鋅等營養(yǎng)素;許多顧客都會購買肥皂和棉球,但當有女性除了購買洗手液和毛巾以外,還突然開始大量采購無味肥皂和特大包裝的棉球時,說明她們的預產期要來了。
在塔吉特的數據庫資料里,統(tǒng)計師們根據顧客內在需求數據,精準地選出其中的25種商品,對這25種商品進行同步分析,基本上可以判斷出哪些顧客是孕婦,甚至還可以進一步估算出她們的預產期,在最恰當的時候給她們寄去最符合她們需要的優(yōu)惠券,滿足她們最實際的需求。依靠分析消費者數據,塔吉特的年營收從2002年的440億美元擴大到2010年的670億美元。這家成立于1961年的零售商能有今天的成功,數據分析功不可沒。
類似案例
特易購優(yōu)惠券的秘密
發(fā)放優(yōu)惠券吸引顧客其實已經是很老套的做法了,而且許多的促銷活動實際只是來掠奪公司未來的銷售額。然而,依賴于扎實的數據分析來定向發(fā)放優(yōu)惠券的特易購,卻可以維持每年超過1億英鎊的銷售額增長。
特易購同樣有會員數據庫,通過已有的數據,就能找到那些對價格敏感的客戶,然后在公司可以接受的最低成本水平上,為這類顧客傾向購買的商品確定一個最低價。這樣的好處一是吸引了這部分顧客,二是不必在其他商品上浪費錢降價促銷。
特易購每季會為顧客量身定做6張優(yōu)惠券。其中4張是客戶經常購買的貨品,而另外2張優(yōu)惠的內容,雖然該客戶從來沒有買過,則是根據該客戶以往的消費行為數據分析,極有可能在未來會購買的產品。僅在1999年,特易購就送出了145000份面向不同的細分客戶群的購物指南雜志和優(yōu)惠券組合。
依靠數據分析,特易購通過這樣有目標的降價,從競爭對手那里吸引來更多的顧客。更妙的是,這樣的低價無損公司整體的盈利水平。通過追蹤這些短期優(yōu)惠券的回籠率,了解到客戶在所有門店的消費情況,特易購還可以精確地計算出投資回報。
潘多拉的數據魔方
美國一家名為潘多拉(Pandora)的在線音樂網站,就特別聘請一些音樂專家,讓他們每個人平均花上20分鐘去分析一首歌曲,并賦予每首歌400種不同的屬性。如果你表示喜歡一首歌,程序會自動尋找跟這首歌“基因”相同的歌曲,猜測你也會喜歡并推薦給你。借助這種人海戰(zhàn)術,潘多拉網站已經分析了74萬首歌曲。2011年6月15日,這家采用推薦引擎技術的網站登陸美國紐約交易所上市。
案例:商業(yè)中情局
不是所有的公司都有實力和足夠的時間自己搭建運行一套數據庫用以分析顧客消費行為和需求,為這些公司提供此項服務的數據分析商便找到了空間。
Acxiom:比谷歌更無所不知
比FBI更無孔不入,比Google更無所不知,比Facebook更無處不在……Acxiom就是這樣一個鮮為人知而又舉足輕重的存在。其主要業(yè)務是“基于數據的市場營銷”,幫助企業(yè)精準定位它的潛在客戶,將服務和產品賣給有需求的客戶。上一個財年,它的利潤達到7726 萬美元,銷售額達到11.3億美元。
在2010 年的投資者演講大會中,Acxiom虛構了一個名為 ScottHughes 的角色,以演示在大量數據的幫助下精準營銷的力量。在演示期間,Hughes登陸了 Facebook 賬號,看到他的朋友剛剛成為電子設備商店Bryce的粉絲。Hunghes也點進了Bryce瀏覽其中的商品,打算購買噴墨打印機。這個行為被Acxiom捕捉到,它會識別消費者的身份,記憶他們的選擇,分辨他們的行為,通過合適的市場營銷來影響他們。
當Hughes再回到Bryce,Acxiom就會通過他在 Facebook 上的活動記錄,向他推薦一款符合他要求的打印機。不過,他注冊了網站,但還是沒有買打印機。然后,Acxiom通過網絡來追蹤 Hughes的去向。
第二天,當Hughes打開 ESPN.com 查看體育新聞,“啪”又出現一個打印機的廣告。到了傍晚,他回到Bryce的網站,然后網站顯示他擁有了10美元返現——這不是隨便顯示的消息。Acxiom 將收集到的和 Hughes 有關的數據進行了分析處理。Hughes被判定為屬于那群喜歡移動設備,屬于中產階級,常用手機轉賬,會參加專業(yè)運動聚會,對價格敏感的那群人。于是Acxiom給 Hughs了10美元折扣,成功出售了打印機。
目前,Acxiom 已經擁有美國 1.9 億人,以及 1.26 億個家庭的數據資料。同時,財富100 強的公司中,有 47個是它的客戶。更厲害的是,“9·11”事件過后,它還因協(xié)助美國政府提供了19個劫機者中11個人的資料而名聲大振。
類似案例
Splunk
今年4月,成立于 2003 年的數據軟件公司
Splunk 在納斯達克[微博]以 16 億美元的市值上市,給大數據行業(yè)打了一針興奮劑。Splunk 提供的軟件產品可以用于監(jiān)控、分析實時及歷史的機器數據,同時為這些海量數據建立索引,將其整理成可以搜索的鏈接??蛻羝髽I(yè)的 IT管理員再也不用在錯誤發(fā)生時逐個排查糾錯了。還有游戲公司使用他們的軟件監(jiān)測游戲功能,確定玩家卡在什么地方,然后游戲公司就可以即時調整游戲,以挽留玩家。
從創(chuàng)立至今,Splunk 的客戶數量已接近 4000 家,遍布全球75個國家,其中一半以上為《財富》100強公司。
潘吉瓦
《商界》曾于2010年10期報道過的潘吉瓦公司,同樣是用數據分析來撬動全球貿易。比如,他們通過41次追蹤《暮光之城》的徽章、襪子的運輸情況,分析在這部電影中主角的服飾對流行趨勢有多大影響率,并將分析結果告知用戶,建議他們對自己的行動作出恰當的調整。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10