
大數據公司挖掘數據價值的49個典型案例(一)
對于企業(yè)來說,100條理論確實不如一個成功的標桿有實踐意義,本文的主旨就是尋找“正在做”大數據的49個樣本。
本文力圖從企業(yè)運營和管理的角度,梳理出發(fā)掘大數據價值的一般規(guī)律:一是以數據驅動的決策,主要通過提高預測概率,來提高決策成功率;二是以數據驅動的流程,主要是形成營銷閉環(huán)戰(zhàn)略,提高銷售漏斗的轉化率;三是以數據驅動的產品,在產品設計階段,強調個性化;在產品運營階段,則強調迭代式創(chuàng)新。
上篇 天然大數據公司的各種套餐
從谷歌、亞馬遜、Facebook、LinkedIn,到阿里、百度、騰訊,都因其擁有大量的用戶注冊和運營信息,成為天然的大數據公司。而像IBM、Oracle、EMC、惠普這類大型技術公司紛紛投身大數據,通過整合大數據的信息和應用,給其他公司提供“硬件軟件 數據”的整體解決方案。我們關注的重點是大數據的價值,第一類公司首當其沖。
下面就是這些天然大數據公司的挖掘價值的典型案例。
01 亞馬遜的“信息公司”
如果全球哪家公司從大數據發(fā)掘出了最大價值,截至目前,答案可能非亞馬遜莫屬。亞馬遜也要處理海量數據,這些交易數據的直接價值更大。作為一家“信息公司”,亞馬遜不僅從每個用戶的購買行為中獲得信息,還將每個用戶在其網站上的所有行為都記錄下來:頁面停留時間、用戶是否查看評論、每個搜索的關鍵詞、瀏覽的商品等等。這種對數據價值的高度敏感和重視,以及強大的挖掘能力,使得亞馬遜早已遠遠超出了它的傳統(tǒng)運營方式。
亞馬遜CTO Werner Vogels在CeBIT上關于大數據的演講,向與會者描述了亞馬遜在大數據時代的商業(yè)藍圖。長期以來,亞馬遜一直通過大數據分析,嘗試定位客戶和和獲取客戶反饋。“在此過程中,你會發(fā)現數據越大,結果越好。為什么有的企業(yè)在商業(yè)上不斷犯錯?那是因為他們沒有足夠的數據對運營和決策提供支持,”Vogels說,“一旦進入大數據的世界,企業(yè)的手中將握有無限可能。”從支撐新興技術企業(yè)的基礎設施到消費內容的移動設備,亞馬遜的觸角已觸及到更為廣闊的領域。
亞馬遜推薦:亞馬遜的各個業(yè)務環(huán)節(jié)都離不開“數據驅動”的身影。在亞馬遜上買過東西的朋友可能對它的推薦功能都很熟悉,“買過X商品的人,也同時買過Y商品”的推薦功能看上去很簡單,卻非常有效,同時這些精準推薦結果的得出過程也非常復雜。
亞馬遜預測:用戶需求預測是通過歷史數據來預測用戶未來的需求。對于書、手機、家電這些東西——亞馬遜內部叫硬需求的產品,你可以認為是“標品”——預測是比較準的,甚至可以預測到相關產品屬性的需求。但是對于服裝這樣軟需求產品,亞馬遜干了十多年都沒有辦法預測得很好,因為這類東西受到的干擾因素太多了,比如:用戶的對顏色款式的喜好,穿上去合不合身,愛人朋友喜不喜歡…… 這類東西太易變,買得人多反而會賣不好,所以需要更為復雜的預測模型。
亞馬遜測試:你會認為亞馬遜網站上的某段頁面文字只是碰巧出現的嗎?其實,亞馬遜會在網站上持續(xù)不斷地測試新的設計方案,從而找出轉化率最高的方案。整個網站的布局、字體大小、顏色、按鈕以及其他所有的設計,其實都是在多次審慎測試后的最優(yōu)結果。
亞馬遜記錄:亞馬遜的移動應用讓用戶有一個流暢的無處不在的體驗的同時,也通過收集手機上的數據深入地了解了每個用戶的喜好信息;更值得一提的是Kindle Fire,內嵌的Silk瀏覽器可以將用戶的行為數據一一記錄下來。
以數據為導向的方法并不僅限于以上領域,亞馬遜的企業(yè)文化就是冷冰冰的數據導向型文化。對于亞馬遜來說,大數據意味著大銷售量。數據顯示出什么是有效的、什么是無效的,新的商業(yè)投資項目必須要有數據的支撐。對數據的長期專注讓亞馬遜能夠以更低的售價提供更好的服務。
02 谷歌的意圖
如果說有一家科技公司準確定義了“大數據”概念的話,那一定是谷歌。根據搜索研究公司comScore的數據,僅2012年3月一個月的時間,谷歌處理的搜索詞條數量就高達122億條。谷歌的體量和規(guī)模,使它擁有比其他大多數企業(yè)更多的應用大數據的途徑。
谷歌搜索引擎本身的設計,就旨在讓它能夠無縫鏈接成千上萬的服務器。如果出現更多的處理或存儲需要,抑或某臺服務器崩潰,谷歌的工程師們只要再添加更多的服務器就能輕松搞定。將所有這些數據集合在一起所帶來的結果是:企業(yè)不僅從最好的技術中獲益,同樣還可以從最好的信息中獲益。下面選擇谷歌公司的其中三個亮點。
谷歌意圖:谷歌不僅存儲了搜索結果中出現的網絡連接,還會儲存用戶搜索關鍵詞的行為,它能夠精準地記錄下人們進行搜索行為的時間、內容和方式,坐擁人們在谷歌網站進行搜索及經過其網絡時所產生的大量機器數據。這些數據能夠讓谷歌優(yōu)化廣告排序,并將搜索流量轉化為盈利模式。谷歌不僅能追蹤人們的搜索行為,而且還能夠預測出搜索者下一步將要做什么。用戶所輸入的每一個搜索請求,都會讓谷歌知道他在尋找什么,所有人類行為都會在互聯網上留下痕跡路徑,谷歌占領了一個絕佳的點位來捕捉和分析該路徑。換言之,谷歌能在你意識到自己要找什么之前預測出你的意圖。這種抓取、存儲并對海量人機數據進行分析,然后據此進行預測的能力,就是數據驅動的產品。
谷歌分析:谷歌在搜索之外還有更多獲取數據的途徑。企業(yè)安裝“谷歌分析”之類的產品來追蹤訪問者在其站點的足跡,而谷歌也可獲得這些數據。網站還使用“谷歌廣告聯盟”,將來自谷歌廣告客戶網的廣告展示在其站點,因此,谷歌不僅可以洞察自己網站上廣告的展示效果,同樣還可以對其他廣告發(fā)布站點的展示效果一覽無余。
谷歌趨勢:既然搜索本身是網民的“意圖數據庫”,當然可以根據某一專題搜索量的漲跌,預測下一步的走勢。谷歌趨勢可以預測旅游、地產、汽車的銷售。此類預測最著名的就是谷歌流感趨勢,跟蹤全球范圍的流感等病疫傳播,依據網民搜索,分析全球范圍內流感等病疫的傳播狀況。
03 eBay的分析平臺
早在2006年,eBay就成立了大數據分析平臺。為了準確分析用戶的購物行為,eBay定義了超過500種類型的數據,對顧客的行為進行跟蹤分析。eBay分析平臺高級總監(jiān)Oliver Ratzesberger說:“在這個平臺上,可以將結構化數據和非結構化數據結合在一起,通過分析促進eBay的業(yè)務創(chuàng)新和利潤增長。”
eBay行為分析:在早期,eBay網頁上的每一個功能的更改,通常由對該功能非常了解的產品經理決定,判斷的依據主要是產品經理的個人經驗。而通過對用戶行為數據的分析,網頁上任何功能的修改都交由用戶去決定?!懊慨斢幸粋€不錯的創(chuàng)意或者點子,我們都會在網站上選定一定范圍的用戶進行測試。通過對這些用戶的行為分析,來看這個創(chuàng)意是否帶來了預期的效果?!?
eBay廣告分析:更顯著的變化反映在廣告費上。eBay對互聯網廣告的投入一直很大,通過購買一些網頁搜索的關鍵字,將潛在客戶引入eBay網站。為了對這些關鍵字廣告的投入產出進行衡量,eBay建立了一個完全封閉式的優(yōu)
04 塔吉特的“數據關聯挖掘”
利用先進的統(tǒng)計方法,商家可以通過用戶的購買歷史記錄分析來建立模型,預測未來的購買行為,進而設計促銷活動和個性服務避免用戶流失到其他競爭對手那邊。美國第三大零售商塔吉特,通過分析所有女性客戶購買記錄,可以“猜出”哪些是孕婦。其發(fā)現女性客戶會在懷孕四個月左右,大量購買無香味乳液。由此挖掘出25項與懷孕高度相關的商品,制作“懷孕預測”指數。推算出預產期后,就能搶先一步,將孕婦裝、嬰兒床等折扣券寄給客戶。塔吉特還創(chuàng)建了一套購買女性行為在懷孕期間產生變化的模型,不僅如此,如果用戶從它們的店鋪中購買了嬰兒用品,它們在接下來的幾年中會根據嬰兒的生長周期定期給這些顧客推送相關產品,使這些客戶形成長期的忠誠度。
05 中國移動的數據化運營
通過大數據分析,中國移動能夠對企業(yè)運營的全業(yè)務進行針對性的監(jiān)控、預警、跟蹤。大數據系統(tǒng)可以在第一時間自動捕捉市場變化,再以最快捷的方式推送給指定負責人,使他在最短時間內獲知市場行情。
客戶流失預警:一個客戶使用最新款的諾基亞手機,每月準時繳費、平均一年致電客服3次,使用WEP和彩信業(yè)務。如果按照傳統(tǒng)的數據分析,可能這是一位客戶滿意度非常高、流失概率非常低的客戶。事實上,當搜集了包括微博、社交網絡等新型來源的客戶數據之后,這位客戶的真實情況可能是這樣的:客戶在國外購買的這款手機,手機中的部分功能在國內無法使用,在某個固定地點手機經常斷線,彩信無法使用——他的使用體驗極差,正在面臨流失風險。這就是中國移動一個大數據分析的應用場景。通過全面獲取業(yè)務信息,可能顛覆常規(guī)分析思路下做出的結論,打破傳統(tǒng)數據源的邊界,注重社交媒體等新型數據來源,通過各種渠道獲取盡可能多的客戶反饋信息,并從這些數據中挖掘更多的價值。
數據增值應用:對運營商來說,數據分析在政府服務市場上前景巨大。運營商也可以在交通、應對突發(fā)災害、維穩(wěn)等工作中使大數據技術發(fā)揮更大的作用。運營商處在一個數據交換中心的地位,在掌握用戶行為方面具有先天的優(yōu)勢。作為信息技術的又一次變革,大數據的出現正在給技術進步和社會發(fā)展帶來全新的方向,而誰掌握了這一方向,誰就可能成功。對于運營商來說,在數據處理分析上,需要轉型的不僅是技巧和法律問題,更需要轉變思維方式,以商業(yè)化角度思考大數據營銷。
06 Twitter中的興趣和情緒
Twitter興趣聚類:通過過濾用戶歸屬地、發(fā)推位置和相關關鍵詞,Twitter建立了一系列定制化的客戶數據流。比如,通過過濾電影片名、位置和情緒標簽,你可以知道洛杉磯、紐約和倫敦等城市最受歡迎的電影是哪些。而根據用戶發(fā)布的個人行為描述,你甚至能搜索到那些在加拿大滑雪的日本游客。從這個視角看,Twitter的興趣圖譜的效率優(yōu)于Facebook的社交圖譜。Twitter的用戶數據所能產生的潛在價值同樣令人驚嘆。在社交媒體網站正在收集越來越多的數據的形勢下,它們或許能找到更好的方式來利用這些數據盈利,并使其取代廣告成為自身提高收入的主要方式。這些社交網站真正的價值可能在于數據本身。相信在不久的將來,如果尋找到既能充分利用用戶數據,又可合理規(guī)避對用戶隱私的威脅,社交數據所蘊藏的巨大能量將會徹底被開啟。
Twitter情緒分析:Twitter自己并不經營每一款數據產品,但它把數據授權給了像DataSift這樣的數據服務公司,很多公司利用Twitter社交數據,做出了各種讓人吃驚的應用,從社交監(jiān)測到醫(yī)療應用,甚至可以去追蹤流感疫情爆發(fā),社交媒體監(jiān)測平臺DataSift還創(chuàng)造了一款金融數據產品。華爾街“德溫特資本市場”公司首席執(zhí)行官保羅·霍廷每天的工作之一,就是利用電腦程序分析全球3.4億微博賬戶的留言,進而判斷民眾情緒,再以“1”到“50”進行打分。根據打分結果,霍廷再決定如何處理手中數以百萬美元計的股票?;敉⒌呐袛嘣瓌t很簡單:如果所有人似乎都高興,那就買入;如果大家的焦慮情緒上升,那就拋售。一些媒體公司會把觀眾收視率數據打包到產品里,再轉賣給頻道制作人和內容創(chuàng)造者。
精確的數據一旦與社交媒體數據相結合,對未來的預測會非常準。
07 特易購的精準定向
聰明的商家通過用戶的購買歷史記錄分析來建立模型,為他們量身預測未來的購物清單,進而設計促銷活動和個性服務,讓他們源源不斷地為之買單。特易購是全球利潤第二大的零售商,這家英國超級市場巨人從用戶行為分析中獲得了巨大的利益。從其會員卡的用戶購買記錄中,特易購可以了解一個用戶是什么“類別”的客人,如速食者、單身、有上學孩子的家庭等等。這樣的分類可以為提供很大的市場回報,比如,通過郵件或信件寄給用戶的促銷可以變得十分個性化,店內的促銷也可以根據周圍人群的喜好、消費的時段來更加有針對性,從而提高貨品的流通。這樣的做法為特易購獲得了豐厚的回報,僅在市場宣傳一項,就能幫助特易購每年節(jié)省3.5億英鎊的費用。
Tesco的優(yōu)惠券:特易購每季會為顧客量身定做6張優(yōu)惠券。其中4張是客戶經常購買的貨品,而另外2張則是根據該客戶以往的消費行為數據分析,極有可能在未來會購買的產品。僅在1999年,特易購就送出了14.5萬份面向不同的細分客戶群的購物指南雜志和優(yōu)惠券組合。更妙的是,這樣的低價無損公司整體的盈利水平。通過追蹤這些短期優(yōu)惠券的回籠率,了解到客戶在所有門店的消費情況,特易購還可以精確地計算出投資回報。發(fā)放優(yōu)惠券吸引顧客其實已經是很老套的做法了,而且許多的促銷活動實際只是來掠奪公司未來的銷售額。然而,依賴于扎實的數據分析來定向發(fā)放優(yōu)惠券的特易購,卻可以維持每年超過1億英鎊的銷售額增長。
特易購同樣有會員數據庫,通過已有的數據,就能找到那些對價格敏感的客戶,然后在公司可以接受的最低成本水平上,為這類顧客傾向購買的商品確定一個最低價。這樣的好處一是吸引了這部分顧客,二是不必在其他商品上浪費錢降價促銷。
特易購的精準運營:這家連鎖超市在其數據倉庫中收集了700萬部冰箱的數據。通過對這些數據的分析,進行更全面的監(jiān)控并進行主動的維修以降低整體能耗。
08 Facebook的好友推薦
Facebook是社交網絡巨擎,但是在挖掘大數據價值方面,好像辦法不多,值得一提的就是好友推薦。Facebook使用大數據來追蹤用戶在其網絡的行為,通過識別你在它的網絡中的好友,從而給出新的好友推薦建議,用戶擁有越多的好友,他們與Facebook之間的黏度就越高。更多的好友意味著用戶會分享更多照片、發(fā)布更多狀態(tài)更新、玩更多的游戲。
09 LinkedIn的獵頭價值
LinkedIn網站使用大數據在求職者和招聘職位之間建立關聯。有了LinkedIn,獵頭們再也不用向潛在的受聘者打陌生電話來碰運氣,而可以通過簡單的搜索找出潛在受聘者并聯系他們。與此相似,求職者也可以通過聯系網站上其他人,自然而然地將自己推銷給潛在的雇主。有兩個例子能夠生動呈現LinkedIn的數據價值:幾年前,LinkedIn忽然發(fā)現近期雷曼兄弟的來訪者多了起來,當時并沒引起重視,過了不久,雷曼兄弟宣布倒閉;而在谷歌宣布退出中國的前一個月,在LinkedIn發(fā)現了一些平時很少見的谷歌產品經理在線,這也是相同的道理。如果LinkedIn針對性地分析某家上
10 沃爾瑪的數據基因
早在1969年沃爾瑪就開始使用計算機來跟蹤存貨,1974年就將其分銷中心與各家商場運用計算機進行庫存控制。1983年,沃爾瑪所有門店都開始采用條形碼掃描系統(tǒng)。1987年,沃爾瑪完成了公司內部的衛(wèi)星系統(tǒng)的安裝,該系統(tǒng)使得總部,分銷中心和各個商場之間可以實現實時,雙向的數據和聲音傳輸。采用這些在當時還是小眾和超前的信息技術來搜集運營數據為沃爾瑪最近20年的崛起打下了堅實的地基,從而發(fā)現了“啤酒與尿布”關聯。
如今,沃爾瑪擁有著全世界最大的數據倉庫,在數據倉庫中存儲著沃爾瑪數千家連鎖店在65周內每一筆銷售的詳細記錄,這使得業(yè)務人員可以通過分析購買行為更加了解他們的客戶。通過這些數據,業(yè)務員可以分析顧客的購買行為,從而供應最佳的銷售服務。沃爾瑪一直致力于改善自身的數據收集技術,從條形碼掃描,到安裝衛(wèi)星系統(tǒng)實現雙向數據傳輸,整個公司都充滿了數據基因。2012年4月,沃爾瑪又收購了一家研究網絡社交基因的公司Kosmix,在數據基因的基礎上,又增加了社交基因。
11 阿里小貸和聚石塔
雖然阿里系的余額寶如日中天,但其實阿里小貸才真正體現出了大數據的價值。早在2010年阿里就已經建立了“淘寶小貸”,通過對貸款客戶下游訂單、上游供應商、經營信用等全方位的評估,就可以在沒有見面情況下,給客戶放款,這當然是對阿里平臺上大數據的挖掘。數據來源于“聚石塔”——一個大型的數據分享平臺,它通過共享阿里巴巴旗下各個子公司的數據資源來創(chuàng)造商業(yè)價值。這款產品就是大數據團隊把淘寶交易流程各個環(huán)節(jié)的數據整合互聯,然后基于商業(yè)理解對信息進行分類儲存和分析加工,并與決策行為連接起來所產生的效果。
12 西爾斯的數據大集成
在過去,美國零售巨頭西爾斯控股公司,需要八周時間才能制定出個性化的銷售方案,但往往做出來的時候,它已不再是最佳方案。痛定思痛,決定整合其專售的三個品牌——Sears、Craftsman、Lands'End的客戶、產品以及銷售數據,使用群集收集來自不同品牌的數據,并在群集上直接分析數據,而不是像以前那樣先存入數據倉庫,避免了浪費時間——先把來自各處的數據合并之后再做分析。這種調整讓公司的推銷方案更快、更精準,可以從海量信息中挖掘價值,但是價值巨大,困難也巨大:這些數據需要超大規(guī)模分析,且分散在不同品牌的數據庫與數據倉庫中,不僅數量龐大而且支離破碎。
西爾斯的困境,在傳統(tǒng)企業(yè)中非常普遍,這些企業(yè)家一直想不通,既然互聯網零售商亞馬遜可以推薦閱讀書目、推薦電影、推薦可供購買的產品,為什么他們所在的企業(yè)卻做不到類似的事情。西爾斯公司首席技術官菲里·謝利(Phil Shelley)說:如果要制定一系列復雜推薦方案質量更高,需要更及時、更細致、更個性化的數據,傳統(tǒng)企業(yè)的IT架構根本不能完成這些任務,需要痛下決心,才能完成轉型。
中篇 輕公司數據創(chuàng)業(yè)狂歡
在這次“數據盛宴”中,是否只有大公司的狂歡?并非如此,從事大數據產業(yè)的輕公司將無處不在。新興的創(chuàng)業(yè)公司通過出售數據和服務更有針對性地提供單個解決方案,把大數據商業(yè)化、商品化,才是更加值得我們關注的模式。這將帶來繼門戶網站、搜索引擎、社交媒體之后的新一波創(chuàng)業(yè)浪潮和產業(yè)革命,并會對傳統(tǒng)的咨詢公司產生強烈沖擊。
13 PredPol的犯罪預測
PredPol公司通過與洛杉磯和圣克魯斯的警方以及一群研究人員合作,基于地震預測算法的變體和犯罪數據來預測犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍內。在洛杉磯運用該算法的地區(qū),盜竊罪和暴力犯罪分布下降了33%和21%。
14 Tipp24 AG的賭徒行為預測
Tipp24 AG針對歐洲博彩業(yè)構建的下注和預測平臺。該公司用KXEN軟件來分析數十億計的交易以及客戶的特性,然后通過預測模型對特定用戶進行動態(tài)的營銷活動。這項舉措減少了90%的預測模型構建時間。SAP公司正在試圖收購KXEN,“SAP想通過這次收購來扭轉其長久以來在預測分析方面的劣勢”。
15 Inrix的堵車預言
交通的參與者多種多樣,是大數據最能發(fā)揮價值的領域。交通流量數據公司Inrix依靠分析歷史和實時路況數據,能給出及時的路況報告,以幫助司機避開正在堵車的路段,并且?guī)退麄兲崆耙?guī)劃好行程。汽車制造商、移動應用開發(fā)者、運輸企業(yè)以及各類互聯網企業(yè)都需要Inrix的路況報告。奧迪、福特、日產、微軟等巨頭都是Inrix的客戶。
16 潘吉瓦的時尚預測
消費者追尋意見領袖的生活方式。潘吉瓦公司就是用數據分析來預測流行趨勢,以此為基礎甚至撬動全球貿易。比如,它們通過41次追蹤《暮光之城》的徽章、襪子的運輸情況,分析在這部電影中主角的服飾對流行趨勢有多大影響率,并將分析結果告知用戶,建議他們對自己的行動做出恰當的調整。
17 潘多拉的音樂推薦
美國在線音樂網站潘多拉特別聘請一些音樂專家,讓他們每個人平均花上20分鐘去分析一首歌曲,并賦予每首歌400種不同的屬性。如果你表示喜歡一首歌,程序會自動尋找跟這首歌“基因”相同的歌曲,猜測你也會喜歡并采用推薦引擎技術推薦給你。借助這種人海戰(zhàn)術,潘多拉網站已經分析了74萬首歌曲。
18 Futrix Health的醫(yī)療方案
Futrix Health是一家專注于用通過數據為患者制定醫(yī)療解決方案的公司,從安裝在智能手機上的個人健康應用,到診所、醫(yī)院里醫(yī)生使用的電子健康記錄儀,甚至是革命性的數字化基因組數據,均連接到后端數據倉庫上。從而為患者制定最佳的醫(yī)院選擇、醫(yī)藥選擇。該如何將采集到醫(yī)療保健機構的大量操作信息,分析患者情況或治療效果,實施任何高效率的措施,使之更具有意義——大數據時代提供的機會,不再是簡單地收集這些數據,而是如何運用數據來更好地認知這個世界。
19 Retention Science的用戶粘性
在零售領域,創(chuàng)業(yè)公司Retention Science發(fā)布了一個為電子商務企業(yè)提供增強用戶粘性的數據分析及市場策略設計的平臺,它的用戶建模引擎具備自學習功能,通過使用算法和統(tǒng)計模型來設計優(yōu)化用戶粘性的策略。平臺的用戶數據分析都是實時進行,以確保用戶行為預測總是符合實際用戶行為更新;同時,動態(tài)的根據這些行為預測來設計一些促銷策略。RS目前已獲得Baroda Ventures, Mohr Davidow Ventures, Double M Partners及一些著名天使投資人130萬美金的投資。
20 眾瀛的婚嫁后推薦
江蘇眾瀛聯合數據科技有限公司構建了這樣一個大數據平臺——將準備結婚的新人作為目標消費者,并把與結婚購物相關的商家加入其中。一對新人到薇薇新娘婚紗影樓拍了婚紗照,在實名登記了自己的信息后會被上傳到大數據平臺上。大數據平臺能根據新人在婚紗影樓的消費情況和偏好風格,大致分析判斷出新人后續(xù)消費需求,即時發(fā)送獎勵和促銷短信。比如邀請他們到紅星美凱龍購買家具、到紅豆家紡選購床上用品、到國美電器選購家用電器、到希爾頓酒店擺酒席……如果新人在紅星美凱龍購買了中式家具,說明他們偏好中國傳統(tǒng)文化,就推薦他們購買紅豆家紡的中式家居用品。
21 Takadu的數字馴水
水,向來是個不好管理的東西:自來水公司發(fā)現某個水壓計出現問題,可能需要花上很長的時間排查共用一個水壓計的若干水管。等找到的時侯,大量的水已經被浪費了。以色列一家名為Takadu的水系統(tǒng)預警服務公司解決了這個問題。Takadu把埋在地下的自來水管道水壓計、用水量和天氣等檢測數據搜集起來,通過亞馬遜的云服務傳回Takadu公司的電腦進行算法分析,如果發(fā)現城市某處地下自來水管道出現爆水管、滲水以及水壓不足等異常狀況,就會用大約10分鐘完成分析生成一份報告,發(fā)回給這片自來水管道的維修部門。報告中,除了提供異常狀況類型以及水管的損壞狀況——每秒漏出多少立方米的水,還能相對精確地標出問題水管具體在哪里。檢測每千米“水路”,Takadu的月收費是1萬美元。
22 百合網的婚戀匹配
電商行業(yè)的現金收入源自數據,而婚戀網站的商業(yè)模型更是根植于對數據的研究。比如,作為一家婚戀網站,百合網不僅需要經常做一些研究報告,分析注冊用戶的年齡、地域、學歷、經濟收入等數據,即便是每名注冊用戶小小的頭像照片,這背后也大有挖掘的價值。百合網研究規(guī)劃部李琦曾經對百合網上海量注冊用戶的頭像信息進行分析,發(fā)現那些受歡迎頭像照片不僅與照片主人的長相有關,同時照片上人物的表情、臉部比例、清晰度等因素也在很大程度上決定了照片主人受歡迎的程度。例如,對于女性會員,微笑的表情、直視前方的眼神和淡淡的妝容能增加自己受歡迎的概率,而那些臉部比例占照片1/2、穿著正式、眼神直視沒有多余pose的男性則更可能成為婚戀網站上的寵兒。
23 Prismatic的新聞外衣
Prismatic是一款個性化新聞應用,只有4名創(chuàng)始員工,憑借互聯網數據爬蟲和社交網絡開發(fā)平臺的數據,依托亞馬遜的云計算平臺,實現了大數據的精益創(chuàng)業(yè)。Prismatic不提供統(tǒng)一的設計精良的新聞訂閱或推薦界面,而是根據分析用戶的Facebook 或Twitter資料,為用戶做一對一的數據分析和推薦。從盈利模式來看,Prismatic不是依靠廣告費生存下來,也不是傳統(tǒng)的新聞媒介,而是一個披著新聞應用外衣的電子商務公司。名義上為了給用戶個性化推薦新聞而得到用戶的個人信息進行數據分析,針對性的推出推薦商品,從而從電子商務中盈利。
24 Opower的對比激勵
人類都有和同類對比的天性,例如,一家政府機構收集不同地點從事同類工作的多組員工的數據,僅僅將這些信息公諸于眾就促使落后員工提高了績效。在能源行業(yè),Opower使用數據對比來提高消費用電的能效,并取得了顯著的成功。作為一家SaaS的創(chuàng)新公司,Opower與多家電力公司合作,分析美國家庭用電費用并將之與周圍的鄰居用電情況進行對比,被服務的家庭每個月都會受到一份對比的報告,顯示自家用電在整個區(qū)域或全美類似家庭所處水平,以鼓勵節(jié)約用電。Opower的服務以覆蓋了美國幾百萬戶居民家庭,預計將為美國消費用電每年節(jié)省5億美元。Opower報告信封,看上去像賬單,它們使用行為技術輕輕地說服公用事業(yè)客戶降低消耗。Opower已經推出了它的大數據平臺 Opower4 ,通過分析各種智能電表和用電行為,電力公司等公用事業(yè)單位成為Opower的盈利來源。而對一般用戶而言,Opower完全是免費的。
25 Chango和Uniqlick的點擊消費
使用新的數據技術,諸如美國的Chango公司和中國的Uniqlick公司正在數字廣告行業(yè)中探索新的商業(yè)模式——實時競拍數字廣告。通過了解互聯網用戶在網絡的搜索、瀏覽等行為,這些公司可以為廣告主提供最有可能對其商品感興趣的用戶群,從而進行精準營銷;更長期的趨勢是,將廣告投放給最有可能購買的用戶群。這樣的做法對于廣告主來說,可以獲得更高的轉換率,而對于發(fā)布廣告的網站來說,也提高了廣告位的價值。
26 眾趣的行為辯析
眾趣是國內第一家社交媒體數據管理平臺,目前國內主要的社交開放平臺在用戶數據的開放性方面仍比較保守,身為第三方數據分析公司,能夠獲得的用戶數據還十分有限,要使用這些用戶數據需獲得用戶許可。眾趣通過運營統(tǒng)計學等相關數據分析原理對用戶數據進行過濾,最終完成的是對一個用戶的行為、動作等個體特征的描述。這些描述可以幫助品牌營銷者了解消費者的消費習慣及需求;也可以幫助企業(yè)的領導增強對自己員工的了解。除了對個體以及群體行為特征的描述外,這些數據分析結果還可用于對用戶群體的行為預測,從而為營銷者提供一些前瞻性的市場分析。眾趣數據分析的結果只能精準到群組而無法達到個人。此類的用戶數據研究除在市場營銷領域具有一定的參考價之外,目前大多還主要用于配合一些小調研。此外,這些數據還可以實現對用戶甚至企業(yè)機構的信用評級,在金融領域也有一定程度的使用。
27 拖拉網的明天猜想
導購電商的拖拉網制作了“明天穿什么”這一應用。在這個應用當中,眾多時裝圈權威人士輸送時裝搭配與風格單品,由用戶任意打分,根據用戶的打分偏好,拖拉網便能猜到明天她們想穿什么,然后為她在數十萬件網購時裝中推薦單品,并且實現直通購買下單。在獲取客戶數據后,后臺分析也是各顯神通。
拖拉網加入了更多變量來考核自己的推薦模式。比如有消費者明天要參加一個聚會,不知道要穿什么風格,也沒有看天氣預報,希望導購網站能幫她把這些場景和自己的信息組合起來,給出一整套的解決方案。于是日期、地域、場合、風格,這些都成為穿衣搭配解決方案的變量,經過不斷的組合呈現給用戶,據拖拉網數據,用戶在看到一個比較優(yōu)質的搭配,并有場景性引導的時候,點擊到最后頁面完成購買的轉化率會比單品推薦高40%。
28 SeeChange的基因健康
現在人們有了把人類基因檔案序列化的能力,這允許醫(yī)生和科學家去預測病人對于某些疾病的易感染性和其他不利的條件,可以減少治療過程的時間和花費。位于舊金山的SeeChange公司創(chuàng)建了一套新的健康保險模式。該公司通過分析客戶的個人健康記錄、醫(yī)療報銷記錄、以及藥店的數據,來判斷該客戶對于慢性病的易感性,并判斷該客戶是否有可能從一些定制的康復套餐中獲利。SeeChange同時設計健康計劃,并設立獎勵機制鼓勵客戶主動完成健康行動,全過程都通過其數據分析引擎來監(jiān)控。
29 Given Imaging的圖像診斷
以色列的Given Imaging公司發(fā)明了一種膠囊,內置攝像頭,患者服用后膠囊能以大約每秒14張照片的頻率拍攝消化道內的情況,并同時傳回外置的圖像接收器,患者病征通過配套的軟件被錄入數據庫,在4至6小時內膠囊相機將通過人體排泄離開體外。一般來說,醫(yī)生都是在靠自己的個人經驗進行病征判斷,難免會對一些疑似陰影拿捏不準甚至延誤病人治療?,F在通過Given Imaging的數據庫,當醫(yī)生發(fā)現一個可疑的腫瘤時,雙擊當前圖像后,過去其他醫(yī)生拍攝過的類似圖像和他們的診斷結果都會悉數被提取出來??梢哉f,一個病人的問題不再是一個醫(yī)生在看,而是成千上萬個醫(yī)生在同時給出意見,并由來自大量其他病人的圖像給出佐證。這樣的數據對比,不但提高了醫(yī)生診斷的效率,還提升了準確度。
30 Entelo的“前獵頭”
真正的技術人才永遠是各大公司的搶手貨,絕對不要坐等他們向你投簡歷,因為在他們還沒有機會寫簡歷之前很可能已經被其他公司搶走了。Entelo公司能替企業(yè)家們推薦那些才剛剛萌發(fā)跳槽動機的高級技術人才,以便先下手為強。
Entelo的數據庫里目前有3億份簡歷。而如何判斷高級人才的跳槽傾向,Entelo有一套正在申請專利的算法。這套算法有70多個指標用于判定跳槽傾向。某公司的股價下跌、高層大換血、剛被另一大公司收購,這些都會被Entelo看作是導致該公司人才跳槽的可能性因素。于是Entelo就會立刻把該公司里的高級人才的信息推送給訂閱了自己服務的企業(yè)家們。企業(yè)家們收到的簡歷跟一般的簡歷還不一樣。Entelo抓取了這些人才在各大社交網絡的信息。這樣企業(yè)家們可以了解該人提交過哪些代碼,在網上都回答了些什么樣的問題,在Twitter上都發(fā)表的是些什么樣的信息??傊?,這些準備“挖角”的企業(yè)家能夠看到一個活生生的目標人才站在面前。
31 FlightCaster和Passur的延誤預測
航空業(yè)分秒必爭,尤其是航班抵達的準確時間。如果一班飛機提前到達,地勤人員還沒準備好,乘客和乘務員就會被困在飛機上白白耽誤時間;如果一班飛機延誤,地勤人員就只能坐著干等,白白消耗成本。美國一家大航空公司從其內部報告中發(fā)現,大約10%的航班的實際到達時間與預計到達時間相差10分鐘以上,30%的航班相差5分鐘以上。FlightCaster是一家提供航班延誤信息預測的公司,主要根據航空公司的航班運行情況進行預測。與航空公司所擁有的類似航班運行情況的專有信息一樣,該公司擁有大量國內航班飛行和航班實時運行狀況的歷史數據。Flightcaster的秘訣就是其對大數據分析的有效利用和使用適當的軟件工具對產出數據進行實時管理。
Passur Aerospace是專門為航空業(yè)提供決策支持的技術公司。通過搜集天氣、航班日程表等公開數據,結合自己獨立收集的其他影響航班因素的非公開數據,綜合預測航班到港時間。時至2012年,Passur公司已經擁有超過155處雷達接收站,每4.6秒就收集一次雷達上每架飛機的一系列信息,這會持續(xù)地帶來海量數據。不僅如此,經過長期的數據收集,Passur擁有了一個超過十年的巨大的多維信息載體,為透徹的分析和恰當的數據模型提供了可能。Passur公司相信,航空公司依據它們提供的航班到達時間做計劃,能為每個機場每年節(jié)省數百萬美元。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03