
R語言實現(xiàn)交通行業(yè)事故案例之黑點確定
淺談道路黑點定義,定義黑點道路為歷史發(fā)生事故起數(shù)較多和近期發(fā)生事故明顯增多兩種道路,并且用簡易事故、一般事故、較大事故、特大事故確定當前發(fā)生事故的嚴重程度,即用當量事故數(shù)表示,事故越嚴重,則當事事故數(shù)越大,當量事故數(shù)定義:
1、歷史事故較多道路
通過對各個道路歷史數(shù)據(jù)的分析,找出歷史發(fā)生事故頻率較大的道路作為黑點道路,對于經(jīng)常發(fā)生事故的道路屬于此類。如,取所有道路三年內(nèi)的當量事故數(shù)作為歷史數(shù)據(jù),找出當量事故數(shù)較大的道路作為預定黑點道路;
2、近期發(fā)生事故遽增道路
分析出近期時段較以往事故發(fā)生明顯增多道路作為預定黑點道路,這樣可以找出歷史發(fā)生事故很少,但是最近明顯發(fā)生了很多事故的道路。如,平時最多發(fā)生事故起數(shù)為1起的事故,近一個月連續(xù)發(fā)生了3起,則同比增長了200%,則此類道路可作為預定黑點道路。
3、預定黑點道路去重
對1和2分析出的預定黑點道路進行合并,找出所有預定事故黑點道路,因為歷史發(fā)生事故較多道路也可能近期突然發(fā)生事故數(shù)增多,也屬于近期發(fā)生事故遽增道路。
針對確定的預定黑點道路,分別運用聚類算法,找出當前道路上事故發(fā)生較密集的各個區(qū)域(比如,使用密度聚類算法),作為事故黑點區(qū)域。地圖展現(xiàn)時只針對發(fā)生較密指定半徑區(qū)域為一個事故黑點區(qū)(一條道路有可能有個黑點區(qū)域),避免地圖展現(xiàn)時整體道路作為一個黑點。
根據(jù)步驟二分析的事故黑點區(qū)域,給定區(qū)域中心坐標和半徑在地圖上展現(xiàn),然后用戶可以標注當前黑點區(qū)域的具體位置。
1、連接Oracle數(shù)據(jù)庫,并讀取所需字段
2、分析歷史事故發(fā)生較多道路,得到結(jié)果集Res
3、分析近期發(fā)生事故遽增道路Res2
4、預定黑點道路去重,得到結(jié)果集Res,并入庫
5、黑點道路上事故發(fā)生較密區(qū)域查找,使用密度聚類算法DBSCAN
附DBSCAN:
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一個比較有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同,它將簇定義為密度相連的點的最大集合,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。DBSCAN自動地確定簇個數(shù),而對于K-means,簇個數(shù)需要作為參數(shù)指定。然而,DBSCAN必須指定另外兩個參數(shù):Eps(鄰域半徑)和MinPts(最少點數(shù))。
DBSCAN中的幾個定義:
Ε鄰域:給定對象半徑為Ε內(nèi)的區(qū)域稱為該對象的Ε鄰域;
核心對象:如果給定對象Ε領(lǐng)域內(nèi)的樣本點數(shù)大于等于MinPts,則稱該對象為核心對象;
直接密度可達:對于樣本集合D,如果樣本點q在p的Ε領(lǐng)域內(nèi),并且p為核心對象,那么對象q從對象p直接密度可達。
密度可達:對于樣本集合D,給定一串樣本點p1,p2….pn,p= p1,q= pn,假如對象pi從pi-1直接密度可達,那么對象q從對象p密度可達。
密度相連:存在樣本集合D中的一點o,如果對象o到對象p和對象q都是密度可達的,那么p和q密度相聯(lián)。
可以發(fā)現(xiàn),密度可達是直接密度可達的傳遞閉包,并且這種關(guān)系是非對稱的。密度相連是對稱關(guān)系。DBSCAN目的是找到密度相連對象的最大集合。
詳細算法描述參考度娘
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03