
![]()
長夜漫漫,無心睡眠,我以為只有我睡不著,原來晶晶姑娘你也睡不著!請問你也是春運沒買到坐票嗎?
每年的這個時候,總會流傳著一張圖片,那就是非洲的角馬大遷徙和春運盛況的對比圖,隱含的意思無非就是說“雨季又過了,又到了春運的季節(jié),男男女女們擠在一起,隨著列車輕輕的搖動,就如同那雄海龜趴在雌海龜?shù)纳砩稀?/span>
所以當百度推出的春運遷徙地圖在央視亮相的時候,馬上讓我眼前一亮。作為這種大數(shù)據(jù)可視化產(chǎn)品的腦殘粉,一定要跳出來贊一下。
一.遷徙地圖背后的大數(shù)據(jù)可視化
從全國遷徙圖首頁可以看出,數(shù)據(jù)來源是百度地圖LBS開放平臺,并且輾轉(zhuǎn)找到此項目的負責人求證后,也驗證了這一產(chǎn)品的數(shù)據(jù)來自于眾多使用了百度地圖的應用所傳送來的定位請求,從而對所有請求信息進行辨認設備和定位位置變化來分析處理全樣數(shù)據(jù)。
上面的話比較拗口,簡單點兒說,就是只要你的手機里裝有使用百度地圖API的應用,那么你的長距離移動就是這張地圖里的一條線。
只拿此刻的數(shù)據(jù)進行一下解讀,1月26日上午十點,在過去八小時內(nèi)最熱的遷入城市前三名是北京重慶和贛州。無論重慶和贛州,都是勞務輸出的重點地區(qū),排名前三理所應當。那么北京為什么位居遷入城市第一?
點開北京的路線詳情就能看到,遷入北京的大部分是廊坊、天津、葫蘆島等地的人,只是把北京當做一個交通中轉(zhuǎn)站而已。這也就是北京能在遷出城市和遷入城市都能名列第一的原因了。
已經(jīng)看到有人質(zhì)疑這種產(chǎn)品有什么作用。在我看來,再牛逼的大數(shù)據(jù)挖掘技術,如果不能以一個接地氣的方式表達出來,那么永遠就只能停留在拙劣的公關PR稿中。舉一個最淺顯的例子,如果鐵道部看完這個圖,那么他們至少知道下一步的高鐵線路應該怎么鋪設。如果你是那個在火車上賣WIFI的小哥,你肯定也會選擇最熱線路吧?賣燒不壞的襪子、越南跌打膏之類的朋友們同理。
前兩天,陌陌也推出了他們春運版的數(shù)據(jù),盤點了熱門回家線路熱門群組各種數(shù)據(jù)。但是看完之后,我陷入了深深的失望,我最盼望的數(shù)據(jù)是“漂亮妹子最多的線路”“漂亮妹子最多的車廂”“D杯以上無座只好站著的漂亮妹子最多的車次”……
二.稱贊與吐槽
一直以來,百度是我心目中人格最分裂的公司,A面是一個善于營銷和自我推廣的公司,但是最近幾年推出的新產(chǎn)品基本都是跟隨型產(chǎn)品,別人先蹚出一條血路,然后百度再用自己龐大的用戶群和流量去拓寬這條路,包括踩死先行者。B面是一個擁有著眾多牛人和牛逼數(shù)據(jù)的GEEK,但是卻不拿這些數(shù)據(jù)來做一些讓人拍案叫絕的東西。
如果想成為谷歌一樣受到全世界尊重的搜索公司,那么百度必須要做一些讓人驚嘆的產(chǎn)品。例如2008年前,谷歌推出了一個單獨的小產(chǎn)品--流感疫情地圖,里面將從世界各國衛(wèi)生組織收集到的流感信息用可視化的方式呈現(xiàn)出來,這樣你在出差的時候,就知道是否應該帶藥品了。(嗯,根據(jù)地圖顯示,我國人民身體素質(zhì)很好,身體倍棒吃嘛嘛香不得感冒)。
從表面上看,這產(chǎn)品對谷歌商業(yè)化產(chǎn)品沒有任何拉動作用,但是經(jīng)過這樣的嘗試,在兩年后,當H1N1病毒肆虐的時候,谷歌已經(jīng)能將患病高發(fā)區(qū)整合進自己的地圖應用了。
百度遷徙地圖算是百度近年來比較少見的,不以拉動任何產(chǎn)品下載使用為目的的數(shù)據(jù)產(chǎn)品了。但是就產(chǎn)品細節(jié)來說,有不少地方有待改進,例如視覺的炫酷感,例如地圖的可點擊操作等等。
無獨有偶,就在五天前,英國《衛(wèi)報》推出了他們的一個數(shù)據(jù)產(chǎn)品,叫做《在天上--航空的百年史》。因為1914年是世界上首個商業(yè)航班試飛成功,當時只有1名乘客。1914年全年也只賣了1205張票,而2013年賣了31億2千萬張飛機票。產(chǎn)品首頁就實時展示了現(xiàn)在全世界上空正在飛行的飛機數(shù)和過去24小時所飛過的航線圖,很炫很酷,并且密集恐懼癥患者慎入。(地址,可能需要翻一下~)
三.大數(shù)據(jù)需要更接地氣
大數(shù)據(jù),要玩起來,才會更好玩。我們經(jīng)常會在公關PR稿中看到這樣的話“在本次發(fā)布會上推出的新版本,是基于大數(shù)據(jù),由業(yè)內(nèi)資深的大數(shù)據(jù)挖掘團隊和機器學習團隊埋頭研究數(shù)月才推出的……”讓人不明覺厲。同樣的句式,放之四海而皆準,例如情趣用品,也可以說“我們這次推出的新的按摩棒,是基于大數(shù)據(jù),由業(yè)內(nèi)資深大數(shù)據(jù)挖掘團隊和機器學習團隊埋頭研究數(shù)月才推出,完全符合絕大多數(shù)中國女性的使用習慣……”
所以,大數(shù)據(jù)現(xiàn)在需要的是將一個泛概念變成一個個接地氣的產(chǎn)品或者項目。例如美國梅西百貨,他們會根據(jù)庫存和需求變化情況,實時的調(diào)整7300萬種商品的實時定價。例如洛杉磯警局,會根據(jù)各個區(qū)域之前的犯罪率和居住情況,預測性的調(diào)整巡邏頻率和力度。
百度遷徙地圖,如今只是剛上線,所以更多起到的是公關和宣傳的作用。而如果這個產(chǎn)品能堅持10年,那么這一定是了解中國產(chǎn)業(yè)結(jié)構變化和人群生態(tài)變化的最簡單的途徑。
打住,寫到這里,突然覺得上面的文字正經(jīng)到了可怕的地步。
我終于在過年回家之前,把自己的狀態(tài)調(diào)整到了一個六線城市里的木訥內(nèi)向男中年,準備在“瓜子花生礦泉水,雞腿盒飯收收腿”的親切鄉(xiāng)音中要變身成地圖上的一條線了……
|
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構數(shù)據(jù)價值的核心操盤手 表格結(jié)構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10