
5個故事告訴你何為“大數(shù)據(jù)”_數(shù)據(jù)分析師
在今天,大數(shù)據(jù)被人們用來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),而大數(shù)據(jù)的潛在價值存在于對數(shù)據(jù)的分析和挖掘。
在凌亂紛繁的海量數(shù)據(jù)背后,表達(dá)了互聯(lián)網(wǎng)用戶日常生活中什么樣的感覺與情緒?一些領(lǐng)先機(jī)構(gòu)試水發(fā)掘大數(shù)據(jù)價值,這樣的案例在社會中已嶄露頭角。
跑步時都愛聽黑眼豆豆
作為全球最大的運(yùn)動品牌公司之一,耐克曾在官網(wǎng)上公布了這樣兩則信息:“在冬天,美國人比歐洲和非洲人都更喜歡跑步這項(xiàng)運(yùn)動,但美國人平均每次跑步的長度和時間都比歐洲人短?!彼阅涂擞媱澰诓煌氖袌鰠^(qū)域做好不同的產(chǎn)品劃分,運(yùn)動鞋的設(shè)計也根據(jù)區(qū)域的不同做了獨(dú)立調(diào)整。
另外,“在全球跑步愛好者中,每次的人均跑步時間為35分鐘。同時,在跑步中聽取的音樂,點(diǎn)播率最高的是黑眼豆豆的《Pump it》”。時間和歌曲的具體信息,都可以直接影響耐克在下階段市場營銷的新想法。
解析:運(yùn)動中的數(shù)據(jù)價值
耐克的成功和市場上的特立獨(dú)行正是來源于對自身產(chǎn)品和消費(fèi)者的數(shù)據(jù)挖掘,早在2006年耐克就和蘋果公司合作發(fā)布了捆綁iPod的NikePlus產(chǎn)品和平臺。
通過運(yùn)動鞋里的一個感測器系統(tǒng),使用者在跑步時的相關(guān)數(shù)據(jù)會被記錄在耐克全球數(shù)據(jù)庫里,NikePlus.com上有實(shí)時數(shù)據(jù)更新,使用者對自己跑步的公里數(shù),消耗的卡路里以及路徑都了如指掌,還可以分享并關(guān)注朋友們?nèi)〉玫倪M(jìn)步。這個創(chuàng)新不僅僅使NikePlus變成了體育運(yùn)動愛好者的Facebook,耐克也成功建立了全球最大的運(yùn)動相關(guān)的網(wǎng)上社區(qū) (超過500萬的活躍注冊用戶,上傳超過幾十億公里數(shù)和幾百億卡路里數(shù))。
誰最能了解女性
2012年年初,一名美國男子闖入了他家附近的超市,“你們怎么能這樣!”男人向店鋪經(jīng)理大吼道,“你們竟然給我女兒發(fā)嬰兒尿片和童車的優(yōu)惠券,她才17歲??!”店鋪經(jīng)理不知道發(fā)生了什么,立刻向來者道歉,表明那肯定是個誤會。然而,經(jīng)理沒有意識到,公司正在運(yùn)行一套大數(shù)據(jù)系統(tǒng)。一個月后,這個憤怒的父親打來電話道歉,因?yàn)槌邪l(fā)來的嬰兒用品促銷廣告并不是誤發(fā),他的女兒的確懷孕了。
解析:數(shù)據(jù)追蹤顧客的需求
大數(shù)據(jù)的價值在美國零售業(yè)早已得到運(yùn)用,以Tesco(樂購)為例,這家全球利潤第二大的零售商從其會員卡的用戶購買記錄中,充分了解一個用戶是什么“類別”的客人,并基于這些分類進(jìn)行一系列的業(yè)務(wù)活動。比如,創(chuàng)建了一套女性購買行為在懷孕期間產(chǎn)生變化的模型,不僅如此,如果用戶從他們的店鋪中購買了嬰兒用品,在接下來的幾年中就會根據(jù)嬰兒的生長周期情況定期給這些顧客推送相關(guān)產(chǎn)品,使這些客戶形成長期的忠誠度。
諸如此類的應(yīng)用,在國際零售行業(yè)巨頭中已屢見不鮮。數(shù)據(jù)的力量,不僅讓商家提升了自己的業(yè)績,還讓客戶為之心甘情愿買單。
海地地震的英雄
在2010年海地發(fā)生地震時,海地人散落在全國各地,由于當(dāng)?shù)氐耐ㄐ疟旧聿⒉话l(fā)達(dá),援助機(jī)構(gòu)為弄清該向哪里提供援助而急得手忙腳亂。傳統(tǒng)上,他們只能通過飛臨災(zāi)區(qū)上空或趕赴災(zāi)區(qū)現(xiàn)場來查找需要援助的人群。另一邊,Ushahidi(一家獨(dú)立的信息分析平臺)通過廣播公布了手機(jī)短信緊急求助號碼,結(jié)果收到了數(shù)千條有關(guān)被困人員的信息。散居在美國各地的大量海地裔美國人翻譯了這些信息,并把它們標(biāo)注在“危機(jī)地圖”上。Ushahidi的志愿者們向海地的美國海岸警衛(wèi)隊(duì)發(fā)送即時消息,告訴他們搜尋地點(diǎn),最終成功營救了當(dāng)?shù)鼐用瘛?/span>
解析:數(shù)據(jù)救人一命
救命英雄正是來自東非肯尼亞的一個開源數(shù)據(jù)分析平臺——Ushahidi,它們一直收集和追蹤有關(guān)暴亂、難民、強(qiáng)奸、死亡等事件的短信報告工作,并按照報告者提供的位置在地圖上標(biāo)明這些事件,并從中分析事件頻發(fā)的位置,從而進(jìn)行預(yù)測和加強(qiáng)管制。
與新聞報道和災(zāi)害應(yīng)對小組相比,Ushahidi可以在更短的時間內(nèi)收集到更多的證據(jù),這些證據(jù)的基礎(chǔ)便是來源于對數(shù)據(jù)分析而進(jìn)行準(zhǔn)確的地理定位,通過實(shí)時變化的地圖信息來實(shí)施營救計劃,在災(zāi)害面前,只有數(shù)據(jù)是最為冷靜和理性的。
犯罪前就執(zhí)行逮捕
總部位于美國猶他州桑迪市的SecureAlert監(jiān)控中心曾經(jīng)發(fā)現(xiàn)一個加州的假釋者每天下午2點(diǎn)左右都出現(xiàn)在同一個路口。根據(jù)進(jìn)一步調(diào)查顯示,該路口是一個學(xué)校巴士??空尽_@里本該是學(xué)生聚集的地方,四處也并無其他公共設(shè)施,相對人群較為稀少。于是該公司將這個情況上報到更高的層級,并且將該報告通知給當(dāng)?shù)鼐觳块T,以做好預(yù)警準(zhǔn)備。最終在假釋者試圖誘拐一名學(xué)生時,便衣警察直接將其逮捕,數(shù)月的路徑跟蹤在公堂上成為了有力證據(jù)。
解析:用數(shù)據(jù)抵御犯罪
SecureAlert公司其實(shí)是一家定位技術(shù)的提供者,公司正致力于通過進(jìn)一步自動化從監(jiān)控到地理位置調(diào)查的過程,來增強(qiáng)系統(tǒng)的預(yù)測能力。實(shí)際上,SecureAlert公司提供了一種內(nèi)置定位功能的腳環(huán),這種腳環(huán)被應(yīng)用于跟蹤預(yù)審被告、假釋罪犯和緩刑罪犯。該技術(shù)使得警察和法院能夠?qū)崟r跟蹤和監(jiān)控犯罪分子,有助于執(zhí)法者提前預(yù)測犯罪行為。
SecureAlert的這項(xiàng)預(yù)測服務(wù),原理并不復(fù)雜,復(fù)雜的是將類似的數(shù)據(jù)收集并形成模式,從中分析作案途徑和手法,以便能在任何時間內(nèi)檢測到犯罪分子活動的不尋常模式。
股市或許要微博預(yù)測拿下
英國的一名80后外匯交易員保羅·霍廷從三位信息學(xué)教授那里獲得靈感,隨后與他們聯(lián)手推出了一款利用推特來預(yù)測股票走勢的對沖基金DerwentCapital(德溫特資本),并大膽承諾,公司推出的交易策略可以獲得的年回報率高達(dá)15%-20%。如此的雄心豪情來源于公司成功的測試效率,他們通過推特上的情緒性詞語可以在一定程度用于預(yù)測道瓊斯工業(yè)指數(shù)的變化。結(jié)果表明人們在網(wǎng)上的情緒變化會在2-6天后影響到指數(shù)的變化,研究者稱,這使得他們預(yù)測的成功率高達(dá)87.6%。
解析:數(shù)據(jù)挖掘進(jìn)行時
Derwent的創(chuàng)始者們并非最早利用推特預(yù)測的人。這家微博網(wǎng)站目前已有高達(dá)2億用戶群體,早就被用來預(yù)測從電影票房到美國和英國選舉的很多事情。而Derwent公司利用計算機(jī)程序,每天通過對3億條推文的抽樣,抓取例如“我感覺”、“我認(rèn)為”、“讓我覺得”等表達(dá)投資者和公眾情緒的語句進(jìn)行分析、歸納,然后做出推斷。他們的試驗(yàn)雖然有待時間的校驗(yàn),但大數(shù)據(jù)挖掘的價值已經(jīng)成為不可輕視的科學(xué)熱流。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11