
十個(gè)有趣的“大數(shù)據(jù)”經(jīng)典數(shù)據(jù)挖掘案例
近兩年,“大數(shù)據(jù)”這個(gè)詞越來(lái)越為大眾所熟悉,“大數(shù)據(jù)”一直是以高冷的形象出現(xiàn)在大眾面前,面對(duì)大數(shù)據(jù),相信許多人都一頭霧水。下面我們通過(guò)十個(gè)經(jīng)典案例,讓大家實(shí)打?qū)嵱|摸一把“大數(shù)據(jù)”。你會(huì)發(fā)現(xiàn)它其實(shí)就在身邊而且也是很有趣的。
啤酒與尿布
全球零售業(yè)巨頭沃爾瑪在對(duì)消費(fèi)者購(gòu)物行為分析時(shí)發(fā)現(xiàn),男性顧客在購(gòu)買嬰兒尿片時(shí),常常會(huì)順便搭配幾瓶啤酒來(lái)犒勞自己,于是嘗試推出了將啤酒和尿布擺在一起的促銷手段。沒想到這個(gè)舉措居然使尿布和啤酒的銷量都大幅增加了。如今,“啤酒+尿布”的數(shù)據(jù)分析成果早已成了大數(shù)據(jù)技術(shù)應(yīng)用的經(jīng)典案例,被人津津樂(lè)道。
數(shù)據(jù)新聞讓英國(guó)撤軍
2010年10月23日《衛(wèi)報(bào)》利用維基解密的數(shù)據(jù)做了一篇“數(shù)據(jù)新聞”。將伊拉克戰(zhàn)爭(zhēng)中所有的人員傷亡情況均標(biāo)注于地圖之上。地圖上一個(gè)紅點(diǎn)便代表一次死傷事件,鼠標(biāo)點(diǎn)擊紅點(diǎn)后彈出的窗口則有詳細(xì)的說(shuō)明:傷亡人數(shù)、時(shí)間,造成傷亡的具體原因。密布的紅點(diǎn)多達(dá)39萬(wàn),顯得格外觸目驚心。一經(jīng)刊出立即引起朝野震動(dòng),推動(dòng)英國(guó)最終做出撤出駐伊拉克軍隊(duì)的決定。
意料之外:胸部最大的是新疆妹子
淘寶數(shù)據(jù)平臺(tái)顯示,購(gòu)買最多的文胸尺碼為B罩杯。B罩杯占比達(dá)41.45%,其中又以75B的銷量最好。其次是A罩杯,購(gòu)買占比達(dá)25.26%,C罩杯只有8.96%。在文胸顏色中,黑色最為暢銷。以省市排名,胸部最大的是新疆妹子。
QQ圈子把前女友推薦給未婚妻
2012年3月騰訊推出QQ圈子,按共同好友的連鎖反應(yīng)攤開用戶的人際關(guān)系網(wǎng),把用戶的前女友推薦給未婚妻,把同學(xué)同事朋友圈子分門別類,利用大數(shù)據(jù)處理能力給人帶來(lái)“震撼”。
“魔鏡”預(yù)知石油市場(chǎng)走向
如果你對(duì)“魔鏡”還停留在“魔鏡魔鏡,告訴我誰(shuí)是世界上最美的女人”,那你就真的out了?!澳хR”不僅僅是童話中王后的寶貝,而且是真實(shí)世界中的一款神器。其實(shí),“魔鏡”是蘇州國(guó)云數(shù)據(jù)科技公司的一款牛逼的大數(shù)據(jù)可視化產(chǎn)品,而且是國(guó)內(nèi)首款喔。
在現(xiàn)在,“魔鏡”可以通過(guò)數(shù)據(jù)的整合分析可視化不僅可以得出誰(shuí)是世界上最美的女人,還能通過(guò)價(jià)量關(guān)系得出市場(chǎng)的走向。在不久前,“魔鏡”幫助中石等企業(yè)分析數(shù)據(jù),將數(shù)據(jù)可視化,使企業(yè)科學(xué)的判斷、決策,節(jié)約成本,合理配置資源,提高了收益。
Google成功預(yù)測(cè)冬季流感
2009年,Google通過(guò)分析5000萬(wàn)條美國(guó)人最頻繁檢索的詞匯,將之和美國(guó)疾病中心在2003年到2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,并建立一個(gè)特定的數(shù)學(xué)模型。最終google成功預(yù)測(cè)了2009冬季流感的傳播甚至可以具體到特定的地區(qū)和州。
大數(shù)據(jù)與喬布斯癌癥治療
喬布斯是世界上第一個(gè)對(duì)自身所有DNA和腫瘤DNA進(jìn)行排序的人。為此,他支付了高達(dá)幾十萬(wàn)美元的費(fèi)用。他得到的不是樣本,而是包括整個(gè)基因的數(shù)據(jù)文檔。醫(yī)生按照所有基因按需下藥,最終這種方式幫助喬布斯延長(zhǎng)了好幾年的生命。
奧巴馬大選連任成功
2012年11月奧巴馬大選連任成功的勝利果實(shí)也被歸功于大數(shù)據(jù),因?yàn)樗母?jìng)選團(tuán)隊(duì)進(jìn)行了大規(guī)模與深入的數(shù)據(jù)挖掘。時(shí)代雜志更是斷言,依靠直覺與經(jīng)驗(yàn)進(jìn)行決策的優(yōu)勢(shì)急劇下降,在政治領(lǐng)域,大數(shù)據(jù)的時(shí)代已經(jīng)到來(lái);各色媒體、論壇、專家鋪天蓋地的宣傳讓人們對(duì)大數(shù)據(jù)時(shí)代的來(lái)臨興奮不已,無(wú)數(shù)公司和創(chuàng)業(yè)者都紛紛跳進(jìn)了這個(gè)狂歡隊(duì)伍。
微軟大數(shù)據(jù)成功預(yù)測(cè)奧斯卡21項(xiàng)大獎(jiǎng)
2013年,微軟紐約研究院的經(jīng)濟(jì)學(xué)家大衛(wèi)?羅斯柴爾德(David Rothschild)利用大數(shù)據(jù)成功預(yù)測(cè)24個(gè)奧斯卡獎(jiǎng)項(xiàng)中的19個(gè),成為人們津津樂(lè)道的話題。今年羅斯柴爾德再接再厲,成功預(yù)測(cè)第86屆奧斯卡金像獎(jiǎng)?lì)C獎(jiǎng)典禮24個(gè)獎(jiǎng)項(xiàng)中的21個(gè),繼續(xù)向人們展示現(xiàn)代科技的神奇魔力。
超市預(yù)知高中生顧客懷孕
明尼蘇達(dá)州一家塔吉特門店被客戶投訴,一位中年男子指控塔吉特將嬰兒產(chǎn)品優(yōu)惠券寄給他的女兒——一個(gè)高中生。但沒多久他卻來(lái)電道歉,因?yàn)榕畠航?jīng)他逼問(wèn)后坦承自己真的懷孕了。塔吉特百貨就是靠著分析用戶所有的購(gòu)物數(shù)據(jù),然后通過(guò)相關(guān)關(guān)系分析得出事情的真實(shí)狀況。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10