
基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型構(gòu)想
背景介紹
警察作為一個(gè)國(guó)家的重要機(jī)構(gòu),肩負(fù)著維護(hù)社會(huì)穩(wěn)定,打擊違法犯罪的重要職責(zé),面對(duì)著越來越狡猾的犯罪分子,警方需要有效提升預(yù)防和打擊犯罪的能力,單靠警員人工破案已無法滿足社會(huì)需求,因此國(guó)家提出“科技強(qiáng)警”的發(fā)展戰(zhàn)略,借助高科技裝備、信息化手段幫助警方打擊違法犯罪,“金盾工程”更是將公安信息化建設(shè)推向了高潮。然而,隨著信息時(shí)代的到來,犯罪分子作案手段越發(fā)多變、隱蔽,傳統(tǒng)的信息化手段已很難幫助警方快速分析研判。
近年來,“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”越來越被人們所熟知,著名的“谷歌汽車”、“大數(shù)據(jù)流感預(yù)測(cè)”更是成為物聯(lián)網(wǎng)技術(shù)與大數(shù)據(jù)預(yù)測(cè)應(yīng)用的經(jīng)典案例。這兩個(gè)在幾年前還不為人知的技術(shù)名詞,仿佛是在一夜之間闖入了我們的生活,將人們拉入了科幻電影中的場(chǎng)景。那什么是“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”呢?
物聯(lián)網(wǎng)技術(shù)是利用互聯(lián)網(wǎng)等通信技術(shù)手段把傳感器、控制器、機(jī)器、人與物通過新的方式聯(lián)系在一起,形成人與物、物與物互聯(lián),實(shí)現(xiàn)信息化,遠(yuǎn)程管理控制和智能化的網(wǎng)絡(luò)。
作為物聯(lián)網(wǎng)之后IT行業(yè)又一大顛覆性的技術(shù)革命,大數(shù)據(jù)是信息爆炸時(shí)代的產(chǎn)物,人們每天上網(wǎng)、交流、購(gòu)物、訂票……產(chǎn)生了數(shù)以億級(jí)的數(shù)據(jù),而這項(xiàng)技術(shù)的意義并不在于掌握了龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化的預(yù)測(cè)處理。
警方分析研判的關(guān)鍵是挖掘人員、組織、案(事)件、陣地以及物品五要素之間的關(guān)聯(lián)關(guān)系,如果能夠借助物聯(lián)網(wǎng)技術(shù)獲取五要素信息,那么將大大提升警方獲取線索信息的效率,同時(shí)也能避免人為錯(cuò)誤。而面對(duì)龐雜的線索信息,則可以借助大數(shù)據(jù)分析技術(shù)實(shí)現(xiàn)深入,高效的挖掘分析,進(jìn)而快速找出五要素之間的關(guān)聯(lián)關(guān)系。
本文試圖探討構(gòu)建一套基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型,借以提高警方線索采集和分析研判過程的準(zhǔn)確性和效率。
技術(shù)架構(gòu)
基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型是一種利用大數(shù)據(jù)分析算法對(duì)海量警務(wù)物聯(lián)網(wǎng)線索信息進(jìn)行深度挖掘分析的系統(tǒng)模型。它包括了物聯(lián)感知層、數(shù)據(jù)傳輸層、數(shù)據(jù)分析層以及數(shù)據(jù)展示層,同時(shí),它還要與現(xiàn)有的公安信息網(wǎng)有效融合,實(shí)現(xiàn)信息共享碰撞。
? 物聯(lián)感知層
警務(wù)物聯(lián)網(wǎng),是指利用感知技術(shù)與智能裝置對(duì)警務(wù)工作關(guān)注對(duì)象進(jìn)行自動(dòng)感知識(shí)別,通過網(wǎng)絡(luò),技術(shù)處理和智能分析,實(shí)現(xiàn)對(duì)關(guān)注對(duì)象狀態(tài)和態(tài)勢(shì)信息的實(shí)時(shí)掌握,達(dá)到對(duì)關(guān)注對(duì)象動(dòng)態(tài)監(jiān)測(cè)、精確管理和科學(xué)指揮的目的。目前警方所應(yīng)用的場(chǎng)景有旅客身份證查驗(yàn)、警車警員GPS定位、城區(qū)視頻監(jiān)控、道路卡口車輛監(jiān)控、重點(diǎn)部位報(bào)警防范、重點(diǎn)人員手機(jī)定位、槍支RFID標(biāo)簽定位等,可以采集到人員、車輛以及物品的城市時(shí)空數(shù)據(jù),為警方建立基本要素排查提供大量真實(shí)可靠的原始數(shù)據(jù)。
? 數(shù)據(jù)傳輸層
經(jīng)過移動(dòng)互聯(lián)網(wǎng)、有線網(wǎng)絡(luò)等媒介傳輸?shù)较到y(tǒng)模型的物聯(lián)網(wǎng)數(shù)據(jù),具有數(shù)據(jù)量大,且分布在不同時(shí)域,空域的特點(diǎn),是無法直接使用的,為此需要按照一定的標(biāo)準(zhǔn)規(guī)則對(duì)它們進(jìn)行初步的篩選和歸類整合,將其轉(zhuǎn)化為兼容系統(tǒng)模型的,具有統(tǒng)一規(guī)范標(biāo)準(zhǔn)的“元數(shù)據(jù)”。
? 數(shù)據(jù)分析層
經(jīng)過初步歸類整合的數(shù)據(jù)依舊是海量且缺乏直觀聯(lián)系關(guān)系,無法為警方提供研判依據(jù),為此需要借助專業(yè)的數(shù)據(jù)挖掘算法對(duì)這些數(shù)據(jù)進(jìn)一步分析、整合。同時(shí)還要與公安信息網(wǎng)中的線索與情報(bào)進(jìn)行碰撞,以降低單一數(shù)據(jù)源造成的信息可靠性低等問題。常用的分析算法有分類分析、回歸分析、聚類分析以及關(guān)聯(lián)分析。
? 分類分析
根據(jù)一定的分類準(zhǔn)則將具有不同特征的數(shù)據(jù)劃分到不同類別的過程。以某地區(qū)團(tuán)伙作案為例,該區(qū)域近一段時(shí)期是團(tuán)伙犯罪高發(fā)期,警方對(duì)該區(qū)域以及鄰近區(qū)域娛樂場(chǎng)所以及出租屋的人員進(jìn)行集中排查,采集到大量的身份證信息和手機(jī)串號(hào)信息。
通過對(duì)午夜時(shí)段的身份證號(hào)以及手機(jī)串號(hào)進(jìn)行碰撞,可以篩選出一批經(jīng)常出入于犯罪高發(fā)區(qū)的可疑人員名單,進(jìn)而幫助警方縮小排查范圍。
? 回歸分析
通過對(duì)自變量和因變量做一定的相關(guān)性分析,由此建立回歸方程,用以預(yù)測(cè)變量的依賴關(guān)系。加利福尼亞警方曾利用火災(zāi)預(yù)警系統(tǒng)來預(yù)測(cè)建筑物火情以及分析縱火案。
加利福尼亞警方通過將一年內(nèi)火災(zāi)案件與當(dāng)天天氣,建筑物自身因素等資料數(shù)據(jù)化,形成了一套火災(zāi)級(jí)別與火災(zāi)因素的擬合函數(shù),當(dāng)火災(zāi)因素點(diǎn)越豐富時(shí),擬合出來的火災(zāi)隱情擬合函數(shù)曲線就越細(xì)膩平滑,精準(zhǔn)度也就越高,進(jìn)而形成經(jīng)驗(yàn)數(shù)據(jù),有效提升火災(zāi)預(yù)警能力。同時(shí),警方也不放過那些異常點(diǎn),因?yàn)橥惓|c(diǎn)代表著具有“人為縱火”嫌疑,警方再通過對(duì)這些異常點(diǎn)的分析,找出隱藏在火災(zāi)背后的案情。
? 聚類分析
不同于分類分析,聚類分析沒有先驗(yàn)知識(shí),一般是將一堆看似毫無規(guī)則的數(shù)據(jù)根據(jù)某種特征進(jìn)行劃分,不同屬性的數(shù)據(jù)分到不同的組。警方可以根據(jù)時(shí)間或者空間為基準(zhǔn)屬性,對(duì)采集到的身份證號(hào),報(bào)警信息,手機(jī)串號(hào)等進(jìn)行分組,進(jìn)而發(fā)現(xiàn)可疑線索。
例如,某文物保護(hù)單位午夜時(shí)分發(fā)生文物盜竊案件,通過對(duì)該單位近一周內(nèi)的監(jiān)控錄像、手機(jī)串號(hào)等數(shù)據(jù)的采樣,警方首先將可疑目標(biāo)鎖定在午夜時(shí)段出現(xiàn)的四個(gè)手機(jī)串號(hào)上,因?yàn)樵摃r(shí)段不可能是正常游客參觀時(shí)段,具有可疑性,但由于作案人帶了頭套和手套,未能取得有價(jià)值的作案監(jiān)控錄像。警方再對(duì)其余時(shí)間進(jìn)行排查碰撞發(fā)現(xiàn),在案發(fā)前三天,可疑目標(biāo)手機(jī)串號(hào)出現(xiàn)在文物展覽時(shí)段,通過對(duì)該時(shí)段的監(jiān)控錄像與手機(jī)串號(hào)進(jìn)行排查定位,就可以有效縮小排查范圍。
? 關(guān)聯(lián)分析
用于在大量雜亂無章的數(shù)據(jù)中尋找有價(jià)值數(shù)據(jù)間的相關(guān)關(guān)系。
通過分析犯罪嫌疑人的基本信息、親朋好友、交通工具、銀行賬戶以及出行記錄等,就能繪制出一張犯罪嫌疑人的關(guān)系網(wǎng),進(jìn)而為警方快速掌握犯罪嫌疑人動(dòng)向提供有力線索。
? 數(shù)據(jù)展示層
伴隨著大數(shù)據(jù)應(yīng)用而出現(xiàn)的技術(shù)還有可視化展示技術(shù),它能夠很直觀的將大數(shù)據(jù)分析產(chǎn)生的晦澀難懂的數(shù)據(jù)以圖表的形式展示出來,幫助警方根據(jù)圖表特征快速研判。本模型針對(duì)警務(wù)案件研判特點(diǎn),選取了幾種常見的圖表模型做展示。
? 關(guān)聯(lián)關(guān)系圖
關(guān)聯(lián)關(guān)系圖與關(guān)聯(lián)分析算法配套使用,用于展示研判分析結(jié)果各元素之間的關(guān)系,該圖將各元素分為中心元素和關(guān)聯(lián)元素,關(guān)聯(lián)元素圍繞著中心元素展開。通常用于犯罪嫌疑主體與客體之間的關(guān)聯(lián)關(guān)系。【注:中心元素和關(guān)聯(lián)元素的要素類型可以相同,也可以不同】
? 時(shí)空時(shí)序圖
通常與分類分析算法、聚類分析算法配合使用,按照時(shí)空屬性,展示行為主體在一定時(shí)空范圍內(nèi)的行為軌跡,通常用于展示犯罪嫌疑人或嫌疑車輛的行為軌跡。
? 熱點(diǎn)分布圖
通常與聚類分析算法配合使用,用于碰撞挖掘人員行為習(xí)慣,關(guān)聯(lián)關(guān)系以及異常行為之間的“共性”。
應(yīng)用架構(gòu)
基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型本身不能直接破案,但它可以幫助警方縮小排查范圍,縮短排查用時(shí)。由于它需要整合多方信息資源,因此是一套跨部門,跨警種的分析應(yīng)用模型。
? 水平維度
警方在辦案過程中經(jīng)常會(huì)遇到多警種配合工作的情況,而各警種獲取線索信息的渠道可能有所不同,導(dǎo)致對(duì)同一個(gè)目標(biāo)元素得到不同的數(shù)據(jù),這時(shí)就需要對(duì)大家獲取的信息進(jìn)行核實(shí),并以某一個(gè)或多數(shù)人的信息為最終結(jié)論數(shù)據(jù)。(注:依靠物聯(lián)網(wǎng)技術(shù)獲取的數(shù)據(jù)會(huì)降低數(shù)據(jù)的差異性概率,但案件線索并非只有物聯(lián)網(wǎng)采樣數(shù)據(jù),還有很多數(shù)據(jù)要通過其他渠道獲得)
? 垂直維度
在應(yīng)用這套模型時(shí),應(yīng)該按照不同級(jí)別,職能分工使用?;鶎訂挝恢饕?fù)責(zé)線索的采集,實(shí)際辦案單位則肩負(fù)線索采集和分析研判過程,而省廳則作直接利用分析研判結(jié)果,對(duì)各區(qū)域的治安情況,警員的工作情況進(jìn)行分析考核。
建設(shè)難點(diǎn)
雖然物聯(lián)網(wǎng)、大數(shù)據(jù)已經(jīng)不再是個(gè)陌生的技術(shù),它也已經(jīng)被廣泛應(yīng)用到各行各業(yè),小到“物品標(biāo)簽”,大到“百度大數(shù)據(jù)分析計(jì)劃”,似乎這兩類技術(shù)無所不能,但事實(shí)上,要想充分發(fā)揮技術(shù)的優(yōu)勢(shì),還需要一定的條件。
物聯(lián)網(wǎng),它被憧憬的應(yīng)用形式之一便是連接城市,各種各樣的傳感器,視頻監(jiān)控?zé)o處不在,追中人們的行動(dòng)并生成大量的數(shù)據(jù),從而更高效的管理城市,但物聯(lián)網(wǎng)技術(shù)的軟硬件缺乏一個(gè)統(tǒng)一或者相對(duì)統(tǒng)一的標(biāo)準(zhǔn),很難靠一家技術(shù)公司就能對(duì)接,整合各家的設(shè)備或系統(tǒng)。
大數(shù)據(jù),一項(xiàng)偉大的發(fā)明,它將“星占卜”變成了“現(xiàn)實(shí)”,但從它的詞意就可以知道,它的樣本即全部,需要大量且非單一的數(shù)據(jù)做支撐,“共享”必不可少,但首先要解決各部門間的信息壁壘,以及跨公安網(wǎng)信息交互引起的信息安全問題。
文章總結(jié)
雖然筆者通過理論依據(jù)以及工作實(shí)踐總結(jié)出了這套系統(tǒng)模型,但模型應(yīng)用到實(shí)際,并構(gòu)建出完整的可實(shí)用的軟件系統(tǒng)仍然有很長(zhǎng)一段路需要走,這需要公安干警以及相關(guān)行業(yè)技術(shù)從業(yè)者的共同努力。
技術(shù)手段不可能直接用于破案,但如果能夠科學(xué)合理的應(yīng)用,充分發(fā)揮它的作用,就能大大提升警方辦案效率。而這些都是建立在完備的管理機(jī)制和人員認(rèn)識(shí)之上的,需要警方、科學(xué)工作者以及社會(huì)共同的努力。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11