
盤點(diǎn)10個有趣的奇葩大數(shù)據(jù)
大數(shù)據(jù)早已成了我們耳熟能詳?shù)脑~匯,大數(shù)據(jù)也逐漸得到的政府,企業(yè)和個人的重視?;诖耍髷?shù)據(jù)究竟在如何影響著我們的生活?
因?yàn)樗?,我們的生活是否變得更舒適?亦或,從此我們的生活細(xì)節(jié)都要暴露在數(shù)據(jù)的分析之下?我們該如何正確認(rèn)識大數(shù)據(jù)?現(xiàn)在,先讓我們了解一些真實(shí)的大數(shù)據(jù)的例子。
從地球到月球的距離
如果我們將一天內(nèi)產(chǎn)生的數(shù)據(jù)全部燒錄進(jìn)DVD光碟內(nèi),那這些光碟疊起來可以搭成地表到月球的DVD高塔,而且還是雙塔。
大數(shù)據(jù)與星星
根據(jù)IDC的分析,2008年時數(shù)碼數(shù)據(jù)量就超過了目前已知的宇宙內(nèi)星星數(shù)量,而且以數(shù)據(jù)成長的速度,2023年時全球數(shù)據(jù)量將會超過亞佛加厥常數(shù)(Avogadro's number)--也就是6.022×10^23。
亞佛加厥常數(shù)
男性內(nèi)褲銷量反映經(jīng)濟(jì)形勢
已故美聯(lián)儲前主席格林斯潘(Alan Greenspan)曾提出過一個著名的"男性內(nèi)褲銷量反映經(jīng)濟(jì)形勢"的理論。即經(jīng)濟(jì)形勢良好,內(nèi)褲銷量會平穩(wěn)上升,反之則下降。
原因很簡單,經(jīng)濟(jì)蕭條時,男性會節(jié)儉開支,少買內(nèi)褲。。。
啤酒與尿布
這是個經(jīng)典的商場數(shù)據(jù)分析案例。在上世紀(jì)90年代,美國沃爾瑪?shù)某泄芾砣藛T分析銷售數(shù)據(jù)時發(fā)現(xiàn)了一個令人難于理解的現(xiàn)象:在某些特定的情況下,"啤酒"與"尿布"兩件看上去毫無關(guān)系的商品會經(jīng)常出現(xiàn)在同一個購物籃中。
啤酒與尿布
在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購買尿布。父親在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現(xiàn)啤酒與尿布這兩件看上去不相干的商品經(jīng)常會出現(xiàn)在同一個購物籃的現(xiàn)象。
第2頁:女性頭發(fā)與經(jīng)濟(jì)波動,手紙與肥皂
女性頭發(fā)與經(jīng)濟(jì)波動
據(jù)日本最大日用品制造公司"花王",于1987年開始在東京銀座對1000名,二十至三十歲女性進(jìn)行的年度民調(diào)后匯編的"發(fā)型統(tǒng)計(jì)"顯示,他們偏好蓄長發(fā)時顯示經(jīng)濟(jì)在復(fù)蘇中,反之則經(jīng)濟(jì)仍在惡化。
比如,1997年,留短發(fā)的比蓄長發(fā)的人多,那年為日本經(jīng)濟(jì)"最差"的一年,2008年經(jīng)濟(jì)有所起色,超過八成受訪女性頭發(fā)都很長。
手紙與肥皂
雙十一海報(bào)
去年“雙十一”(11.11)這一天,京東商城賣出了80萬塊香皂,重量約115噸,相當(dāng)于23頭大象;基情無限的同時,手紙賣出900萬卷,8億多抽手紙,按一秒鐘扯一抽的話,至少要扯3年,按一卷紙30米算,900萬卷至少可繞地球7圈。
處女座與小龍蝦
根據(jù)"首屆小龍蝦美食節(jié)"的"小云WiFi美食大數(shù)據(jù)"顯示,女性對美食喜歡程度超過男性,66%的女性喜歡吃小龍蝦;而在年齡統(tǒng)計(jì)中發(fā)現(xiàn),20-25歲的美食達(dá)人最多,處女座是所有星座中最愛食用小龍蝦的人群。
一位美食大V不無嚴(yán)肅的認(rèn)為,從一個側(cè)面說明現(xiàn)在商家的小龍蝦的制作工藝、烹飪方式已經(jīng)達(dá)到了一定的高水準(zhǔn),"畢竟處女座的追毛求疵的性格是不爭的事實(shí)"。
女服務(wù)員與股市
在這個刷臉的時代,容貌早已成了求職的隱形標(biāo)準(zhǔn)(不過鳳姐當(dāng)上鳳凰客戶端主筆,理當(dāng)另說)。據(jù)紐約觀察員的解讀,當(dāng)美艷的女服務(wù)員隨店可見時,經(jīng)濟(jì)必陷困境,反之則顯示經(jīng)濟(jì)興旺,換句話說,當(dāng)你到處碰見美女服務(wù)員,便可考慮拋售股票。
服務(wù)員與股市
該觀察員的解釋是,當(dāng)經(jīng)濟(jì)紅火,頗有點(diǎn)"資本"的女性很容易找到工作環(huán)境舒適的工作,諸如商品模特、推銷員等。此外,男性經(jīng)濟(jì)寬裕后也更容易"金屋藏嬌"。
大數(shù)據(jù)遇到愛情
美國波士頓數(shù)學(xué)家克里斯·麥金利(Chris McKinlay)注冊一個婚戀網(wǎng)站后,認(rèn)為他們的配對模式不合適,于是他自己寫程序,只花了不到90天時間就在茫茫人海中找到了心儀的對象。
這位克里斯開設(shè)了12個賬戶,利用計(jì)算機(jī)程序隨意作答網(wǎng)站的配對問卷,從2萬名用戶中收集到600萬條問題的答案,然后利用演算程序篩選出5000名住在美國的活躍用戶,從中按性格分類又選出最符合擇偶條件的2組女子。
第3頁:看完速7,去速8;大數(shù)據(jù)遇上愛情
之后克里斯又創(chuàng)建了兩個賬號,誠實(shí)地回答這兩類姑娘們最關(guān)注的500個問題?;卮鹜陠栴}后,他發(fā)現(xiàn)和自己匹配度在90%以上的超過10000人,最高匹配度達(dá)到了99%。
克里斯·麥金利
為了獲得這些姑娘們的關(guān)注??死锼咕幜艘粋€新程序,自動訪問與他匹配度高的對象,對方回訪他的頁面時,就會給他留言。
在經(jīng)過不少嘗試后,克里斯終于約到一名亞裔女孩。他見面時主動披露破解網(wǎng)站的秘訣,對方極為欣賞,二人開始戀愛關(guān)系。并在戀愛一周年后克里斯求婚成功,二人終成眷屬。如此"用心",也是醉了。
食色性也 "看完速7,去速8"
《速度與激情7》
食色性也:凡是人的生命,不離兩件大事:飲食、男女?!端俣扰c激情7》上映時,"看完速7,去速8"一度成為相互調(diào)侃的流行語。而日前,貓眼電影整合了2015年上半年的售票數(shù)據(jù),做了一個有意思的數(shù)據(jù)報(bào)告。報(bào)告根據(jù)用戶購買電影票的習(xí)慣,結(jié)合用戶在美團(tuán)上的相關(guān)消費(fèi)行為,發(fā)現(xiàn)了有意思的現(xiàn)象。
數(shù)據(jù)顯示,用戶在購買電影票的同時,有79%會進(jìn)行餐飲消費(fèi),10%會選擇唱K、桌游、足療等休閑活動,還有11%會選擇酒店消費(fèi)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11