
5個(gè)故事告訴你何為“大數(shù)據(jù)”_數(shù)據(jù)分析師
在今天,大數(shù)據(jù)被人們用來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),而大數(shù)據(jù)的潛在價(jià)值存在于對(duì)數(shù)據(jù)的分析和挖掘。
在凌亂紛繁的海量數(shù)據(jù)背后,表達(dá)了互聯(lián)網(wǎng)用戶(hù)日常生活中什么樣的感覺(jué)與情緒?一些領(lǐng)先機(jī)構(gòu)試水發(fā)掘大數(shù)據(jù)價(jià)值,這樣的案例在社會(huì)中已嶄露頭角。
跑步時(shí)都愛(ài)聽(tīng)黑眼豆豆
作為全球最大的運(yùn)動(dòng)品牌公司之一,耐克曾在官網(wǎng)上公布了這樣兩則信息:“在冬天,美國(guó)人比歐洲和非洲人都更喜歡跑步這項(xiàng)運(yùn)動(dòng),但美國(guó)人平均每次跑步的長(zhǎng)度和時(shí)間都比歐洲人短?!彼阅涂擞?jì)劃在不同的市場(chǎng)區(qū)域做好不同的產(chǎn)品劃分,運(yùn)動(dòng)鞋的設(shè)計(jì)也根據(jù)區(qū)域的不同做了獨(dú)立調(diào)整。
另外,“在全球跑步愛(ài)好者中,每次的人均跑步時(shí)間為35分鐘。同時(shí),在跑步中聽(tīng)取的音樂(lè),點(diǎn)播率最高的是黑眼豆豆的《Pump it》”。時(shí)間和歌曲的具體信息,都可以直接影響耐克在下階段市場(chǎng)營(yíng)銷(xiāo)的新想法。
解析:運(yùn)動(dòng)中的數(shù)據(jù)價(jià)值
耐克的成功和市場(chǎng)上的特立獨(dú)行正是來(lái)源于對(duì)自身產(chǎn)品和消費(fèi)者的數(shù)據(jù)挖掘,早在2006年耐克就和蘋(píng)果公司合作發(fā)布了捆綁iPod的NikePlus產(chǎn)品和平臺(tái)。
通過(guò)運(yùn)動(dòng)鞋里的一個(gè)感測(cè)器系統(tǒng),使用者在跑步時(shí)的相關(guān)數(shù)據(jù)會(huì)被記錄在耐克全球數(shù)據(jù)庫(kù)里,NikePlus.com上有實(shí)時(shí)數(shù)據(jù)更新,使用者對(duì)自己跑步的公里數(shù),消耗的卡路里以及路徑都了如指掌,還可以分享并關(guān)注朋友們?nèi)〉玫倪M(jìn)步。這個(gè)創(chuàng)新不僅僅使NikePlus變成了體育運(yùn)動(dòng)愛(ài)好者的Facebook,耐克也成功建立了全球最大的運(yùn)動(dòng)相關(guān)的網(wǎng)上社區(qū) (超過(guò)500萬(wàn)的活躍注冊(cè)用戶(hù),上傳超過(guò)幾十億公里數(shù)和幾百億卡路里數(shù))。
誰(shuí)最能了解女性
2012年年初,一名美國(guó)男子闖入了他家附近的超市,“你們?cè)趺茨苓@樣!”男人向店鋪經(jīng)理大吼道,“你們竟然給我女兒發(fā)嬰兒尿片和童車(chē)的優(yōu)惠券,她才17歲?。 钡赇伣?jīng)理不知道發(fā)生了什么,立刻向來(lái)者道歉,表明那肯定是個(gè)誤會(huì)。然而,經(jīng)理沒(méi)有意識(shí)到,公司正在運(yùn)行一套大數(shù)據(jù)系統(tǒng)。一個(gè)月后,這個(gè)憤怒的父親打來(lái)電話(huà)道歉,因?yàn)槌邪l(fā)來(lái)的嬰兒用品促銷(xiāo)廣告并不是誤發(fā),他的女兒的確懷孕了。
解析:數(shù)據(jù)追蹤顧客的需求
大數(shù)據(jù)的價(jià)值在美國(guó)零售業(yè)早已得到運(yùn)用,以Tesco(樂(lè)購(gòu))為例,這家全球利潤(rùn)第二大的零售商從其會(huì)員卡的用戶(hù)購(gòu)買(mǎi)記錄中,充分了解一個(gè)用戶(hù)是什么“類(lèi)別”的客人,并基于這些分類(lèi)進(jìn)行一系列的業(yè)務(wù)活動(dòng)。比如,創(chuàng)建了一套女性購(gòu)買(mǎi)行為在懷孕期間產(chǎn)生變化的模型,不僅如此,如果用戶(hù)從他們的店鋪中購(gòu)買(mǎi)了嬰兒用品,在接下來(lái)的幾年中就會(huì)根據(jù)嬰兒的生長(zhǎng)周期情況定期給這些顧客推送相關(guān)產(chǎn)品,使這些客戶(hù)形成長(zhǎng)期的忠誠(chéng)度。
諸如此類(lèi)的應(yīng)用,在國(guó)際零售行業(yè)巨頭中已屢見(jiàn)不鮮。數(shù)據(jù)的力量,不僅讓商家提升了自己的業(yè)績(jī),還讓客戶(hù)為之心甘情愿買(mǎi)單。
海地地震的英雄
在2010年海地發(fā)生地震時(shí),海地人散落在全國(guó)各地,由于當(dāng)?shù)氐耐ㄐ疟旧聿⒉话l(fā)達(dá),援助機(jī)構(gòu)為弄清該向哪里提供援助而急得手忙腳亂。傳統(tǒng)上,他們只能通過(guò)飛臨災(zāi)區(qū)上空或趕赴災(zāi)區(qū)現(xiàn)場(chǎng)來(lái)查找需要援助的人群。另一邊,Ushahidi(一家獨(dú)立的信息分析平臺(tái))通過(guò)廣播公布了手機(jī)短信緊急求助號(hào)碼,結(jié)果收到了數(shù)千條有關(guān)被困人員的信息。散居在美國(guó)各地的大量海地裔美國(guó)人翻譯了這些信息,并把它們標(biāo)注在“危機(jī)地圖”上。Ushahidi的志愿者們向海地的美國(guó)海岸警衛(wèi)隊(duì)發(fā)送即時(shí)消息,告訴他們搜尋地點(diǎn),最終成功營(yíng)救了當(dāng)?shù)鼐用瘛?/span>
解析:數(shù)據(jù)救人一命
救命英雄正是來(lái)自東非肯尼亞的一個(gè)開(kāi)源數(shù)據(jù)分析平臺(tái)——Ushahidi,它們一直收集和追蹤有關(guān)暴亂、難民、強(qiáng)奸、死亡等事件的短信報(bào)告工作,并按照?qǐng)?bào)告者提供的位置在地圖上標(biāo)明這些事件,并從中分析事件頻發(fā)的位置,從而進(jìn)行預(yù)測(cè)和加強(qiáng)管制。
與新聞報(bào)道和災(zāi)害應(yīng)對(duì)小組相比,Ushahidi可以在更短的時(shí)間內(nèi)收集到更多的證據(jù),這些證據(jù)的基礎(chǔ)便是來(lái)源于對(duì)數(shù)據(jù)分析而進(jìn)行準(zhǔn)確的地理定位,通過(guò)實(shí)時(shí)變化的地圖信息來(lái)實(shí)施營(yíng)救計(jì)劃,在災(zāi)害面前,只有數(shù)據(jù)是最為冷靜和理性的。
犯罪前就執(zhí)行逮捕
總部位于美國(guó)猶他州桑迪市的SecureAlert監(jiān)控中心曾經(jīng)發(fā)現(xiàn)一個(gè)加州的假釋者每天下午2點(diǎn)左右都出現(xiàn)在同一個(gè)路口。根據(jù)進(jìn)一步調(diào)查顯示,該路口是一個(gè)學(xué)校巴士??空?。這里本該是學(xué)生聚集的地方,四處也并無(wú)其他公共設(shè)施,相對(duì)人群較為稀少。于是該公司將這個(gè)情況上報(bào)到更高的層級(jí),并且將該報(bào)告通知給當(dāng)?shù)鼐觳块T(mén),以做好預(yù)警準(zhǔn)備。最終在假釋者試圖誘拐一名學(xué)生時(shí),便衣警察直接將其逮捕,數(shù)月的路徑跟蹤在公堂上成為了有力證據(jù)。
解析:用數(shù)據(jù)抵御犯罪
SecureAlert公司其實(shí)是一家定位技術(shù)的提供者,公司正致力于通過(guò)進(jìn)一步自動(dòng)化從監(jiān)控到地理位置調(diào)查的過(guò)程,來(lái)增強(qiáng)系統(tǒng)的預(yù)測(cè)能力。實(shí)際上,SecureAlert公司提供了一種內(nèi)置定位功能的腳環(huán),這種腳環(huán)被應(yīng)用于跟蹤預(yù)審被告、假釋罪犯和緩刑罪犯。該技術(shù)使得警察和法院能夠?qū)崟r(shí)跟蹤和監(jiān)控犯罪分子,有助于執(zhí)法者提前預(yù)測(cè)犯罪行為。
SecureAlert的這項(xiàng)預(yù)測(cè)服務(wù),原理并不復(fù)雜,復(fù)雜的是將類(lèi)似的數(shù)據(jù)收集并形成模式,從中分析作案途徑和手法,以便能在任何時(shí)間內(nèi)檢測(cè)到犯罪分子活動(dòng)的不尋常模式。
股市或許要微博預(yù)測(cè)拿下
英國(guó)的一名80后外匯交易員保羅·霍廷從三位信息學(xué)教授那里獲得靈感,隨后與他們聯(lián)手推出了一款利用推特來(lái)預(yù)測(cè)股票走勢(shì)的對(duì)沖基金DerwentCapital(德溫特資本),并大膽承諾,公司推出的交易策略可以獲得的年回報(bào)率高達(dá)15%-20%。如此的雄心豪情來(lái)源于公司成功的測(cè)試效率,他們通過(guò)推特上的情緒性詞語(yǔ)可以在一定程度用于預(yù)測(cè)道瓊斯工業(yè)指數(shù)的變化。結(jié)果表明人們?cè)诰W(wǎng)上的情緒變化會(huì)在2-6天后影響到指數(shù)的變化,研究者稱(chēng),這使得他們預(yù)測(cè)的成功率高達(dá)87.6%。
解析:數(shù)據(jù)挖掘進(jìn)行時(shí)
Derwent的創(chuàng)始者們并非最早利用推特預(yù)測(cè)的人。這家微博網(wǎng)站目前已有高達(dá)2億用戶(hù)群體,早就被用來(lái)預(yù)測(cè)從電影票房到美國(guó)和英國(guó)選舉的很多事情。而Derwent公司利用計(jì)算機(jī)程序,每天通過(guò)對(duì)3億條推文的抽樣,抓取例如“我感覺(jué)”、“我認(rèn)為”、“讓我覺(jué)得”等表達(dá)投資者和公眾情緒的語(yǔ)句進(jìn)行分析、歸納,然后做出推斷。他們的試驗(yàn)雖然有待時(shí)間的校驗(yàn),但大數(shù)據(jù)挖掘的價(jià)值已經(jīng)成為不可輕視的科學(xué)熱流。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱(chēng)為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見(jiàn)需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫(xiě)入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢(xún)性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開(kāi)發(fā)中,開(kāi)發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書(shū):以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開(kāi)啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書(shū)) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11