
從LBS大數(shù)據(jù)背后分析外灘踩踏事故始末
上海外灘踩踏事故發(fā)生已經(jīng)過去了半個(gè)多月,痛定思痛,從普通民眾到專家教授,紛紛通過媒體對此事發(fā)表了自己的意見,希望能找到事故的真正原因,避免悲劇再度發(fā)生。
百度研究院大數(shù)據(jù)實(shí)驗(yàn)室BDL(Big Data Lab),秉承“以數(shù)據(jù)說話”的理念,基于百度數(shù)據(jù)與大數(shù)據(jù)智能分析技術(shù),嘗試對當(dāng)時(shí)的情況進(jìn)行數(shù)據(jù)化描述,希望可以給相關(guān)人士提供一些參考。
圖1標(biāo)明了南京東路地鐵站附近區(qū)域(左下藍(lán)框)、外灘源附近區(qū)域(右上藍(lán)框)、事發(fā)地陳毅廣場附近區(qū)域(右下黑框)和外灘區(qū)域(右側(cè)紅框)位置在2014年12月31日事發(fā)當(dāng)時(shí)的人群熱力圖。顏色越紅表示人群越密集,越藍(lán)表示越稀疏。下文將聚焦在三個(gè)問題上進(jìn)行討論。
圖1 2014.12.31 事發(fā)時(shí)外灘區(qū)域人群熱力圖
一、當(dāng)時(shí)的人流量大到什么程度?事發(fā)當(dāng)時(shí)是否是當(dāng)晚人流量最大的時(shí)候?
通過大數(shù)據(jù)分析,我們可以看到:
1)如圖2所示,事發(fā)當(dāng)晚,外灘區(qū)域(包含陳毅廣場)確實(shí)非常擁擠,人流量已經(jīng)達(dá)到了平時(shí)最高值的3倍多。
圖2 2014.12.29-2015.1.2外灘區(qū)域人流量趨勢
2)如圖3所示,31日當(dāng)晚20:30左右,南京東路地鐵站(紫線)也曾出現(xiàn)過一個(gè)人流高峰。而事發(fā)當(dāng)時(shí)(黑色虛線),并不是陳毅廣場(紅線)人流量最大的時(shí)候,其兩次人流量高峰出現(xiàn)在21點(diǎn)和24點(diǎn)。
圖3 2014.12.31-2015.1.1人流量趨勢圖
二、當(dāng)時(shí)人流的對沖到底是什么樣的程度
有專家表示人流對沖可能是踩踏的很大一個(gè)原因,利用大數(shù)據(jù)技術(shù)結(jié)合地圖定位信息,從歷史定位與軌跡數(shù)據(jù)里可以看到事發(fā)地的人流方向相對于其他節(jié)假日確實(shí)顯得更加復(fù)雜。我們用中秋節(jié)、國慶節(jié)以及跨年三個(gè)節(jié)日的數(shù)據(jù)進(jìn)行比較。
(1)中秋前夜 (2)國慶當(dāng)晚 (3)跨年當(dāng)晚
圖4 外灘和外灘源區(qū)域人群分布熱力圖(2小時(shí))
通過圖4的2小時(shí)人群分布熱力圖可以看出,三個(gè)節(jié)日當(dāng)晚人流量基本相當(dāng),不過分布不同。中秋節(jié)(圖4(1))和國慶(圖4(2))人群主要分布在外灘觀景大道和陳毅廣場附近,而在跨年當(dāng)天22點(diǎn)之后(圖4(3)),人群主要分布在中山東一路、陳毅廣場和外灘源附近。
(1)中秋前夜 (2)國慶當(dāng)晚 (3)跨年當(dāng)晚
圖5 外灘和外灘源區(qū)域人群流動方向示意圖(部分采樣)
圖5采樣選取了部分人群,示意他們的運(yùn)動方向。圖中,每個(gè)箭頭代表一名行人,箭頭的顏色及指向表示其前進(jìn)方向。圖5(3)可以看出,跨年當(dāng)晚人群從 南京東路流向陳毅廣場,導(dǎo)致在晚上21點(diǎn)左右,陳毅廣場的人流量達(dá)到一個(gè)峰值(圖3)。而之后,更多的人群開始從陳毅廣場沿著中山東一路流向北部的外灘 源,也就是事發(fā)當(dāng)天燈光秀所在地。
(1)中秋前夜 (2)國慶當(dāng)晚 (3)跨年當(dāng)晚
圖6 外灘區(qū)域人群流動方向分布圖
我們進(jìn)一步對圖5中外灘區(qū)域的人流進(jìn)行量化分析,得到了圖6所示的人群流動方向分布圖。圖6中每一扇形分區(qū)代表不同的人流方向,扇區(qū)半徑表示該方向 人流量大小。圖6(1-2)分別表示中秋和國慶當(dāng)晚的情況,可以看出,人流方向比較簡單和清晰,即南北向人流較多,其他方向人流較少。圖6(3)顯示了跨 年當(dāng)晚的外灘區(qū)域的人流方向。除了南北雙向的人流,還有其他多個(gè)方向人流,人群流動方向分布混亂。
針對產(chǎn)生復(fù)雜人群流動方向的原因,有專家這樣推測,中秋節(jié)、國慶節(jié)游客只是單純的外灘游覽;而在跨年當(dāng)晚,很多游客是為了去觀看燈光秀,但是到了陳 毅廣場后才發(fā)現(xiàn)燈光秀地點(diǎn)更改(往年都在陳毅廣場,今年更改為外灘源)。從百度搜索關(guān)鍵詞分析里面也看到這一趨勢。當(dāng)晚23:20左右,搜索“燈光秀取消 了么”和“燈光秀門票”的關(guān)鍵詞的數(shù)量急劇增加(圖7)。
圖7 搜索“燈光秀取消了么”和“燈光秀門票”的關(guān)鍵詞指數(shù)
從手機(jī)地圖使用習(xí)慣來看,游客去目的地前,一般都會提前利用地圖搜索目的地和規(guī)劃路線,燈光秀地點(diǎn)在外灘源,那么用戶應(yīng)該會搜索“外灘源”并規(guī)劃路 徑。我們研究了當(dāng)晚游客到底在什么位置通過百度地圖搜索“外灘源”,發(fā)現(xiàn)大部分都集中在外灘附近(圖8中紅色區(qū)域),這從某種程度上就說明用戶原本不知道 燈光秀更改為外灘源,到了外灘以后才發(fā)現(xiàn)改了地方,所以才掏出手機(jī)進(jìn)行地圖搜索。
圖8 以“外灘源”為目標(biāo)的地圖搜索發(fā)起點(diǎn)熱力圖
三、群體聚集是突發(fā)情況,可以預(yù)警嗎?
我國人口眾多,重大文體活動、節(jié)假日集會等活動中,容易出現(xiàn)因人群過度擁擠而引發(fā)的危險(xiǎn)乃至事故。那么是否可以提前預(yù)測,做到事前預(yù)警呢?大數(shù)據(jù)實(shí)驗(yàn)室對百度的定位數(shù)據(jù)、搜索數(shù)據(jù)進(jìn)行了深度挖掘,探索預(yù)警的可能性。
圖9 外灘地圖搜索與人群匯聚情況趨勢圖
圖9代表2014年12月25日至31日,外灘地圖搜索請求與人群匯聚情況的歷史趨勢。從兩條曲線經(jīng)過標(biāo)準(zhǔn)化和對齊后的走勢中,我們不難看出他們基本一致的漲落趨勢。平時(shí),外灘的地圖搜索和人群匯聚程度基本穩(wěn)定,但在2014年的最后一天,兩者都達(dá)到了最高峰。
圖10 外灘地圖搜索請求與人員到達(dá)數(shù)量相關(guān)性分析
通過對百度的定位數(shù)據(jù)、搜索數(shù)據(jù)進(jìn)行挖掘。進(jìn)一步對2014年12月31日的地圖搜索請求與人員到達(dá)數(shù)量進(jìn)行相關(guān)性分析。由圖10得到,在百度地圖 中,相關(guān)地點(diǎn)的請求數(shù)據(jù)和實(shí)際到達(dá)該地點(diǎn)人群數(shù)量具有極高的相關(guān)性,相關(guān)系數(shù)超過0.9(越接近1,說明越相關(guān))。這表明,用戶去目的地前,一般都會提前 利用百度地圖搜索地點(diǎn)和規(guī)劃路線。為了挖掘用戶的時(shí)間提前量,包括外灘跨年時(shí)的數(shù)據(jù),大數(shù)據(jù)實(shí)驗(yàn)室又對大量歷史群體聚集場合的數(shù)據(jù)進(jìn)行進(jìn)一步的分析,包括 鳥巢足球賽等。
圖11 外灘地圖搜索與人群數(shù)量的互相關(guān)性曲線
通過對大量歷史數(shù)據(jù)分析發(fā)現(xiàn),相關(guān)地點(diǎn)的地圖搜索請求峰值會早于人群密度高峰幾十分鐘出現(xiàn)(可參見圖9)。在圖11中我們給出了搜索量和人群數(shù)量之 間的互相關(guān)性相對于時(shí)延的變化曲線,其中X軸的值為時(shí)延量,負(fù)值即表示提前量,例如-10對上去曲線的值,就是提前10小時(shí)的搜索量與人群數(shù)量的相關(guān)性。 圖中可以發(fā)現(xiàn),兩個(gè)量的互相關(guān)性曲線在-1.5小時(shí)的時(shí)候達(dá)到了峰值,這意味著,根據(jù)地圖上相關(guān)地點(diǎn)搜索的請求量,我們至少可能提前幾十分鐘預(yù)測出人流量 峰值的到來。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07