
大數(shù)據(jù)與偵查模式變革研究(1)_數(shù)據(jù)分析師培訓(xùn)
大數(shù)據(jù)在西方廣泛應(yīng)用于總統(tǒng)選舉預(yù)測(cè)、商業(yè)營(yíng)銷、疾病預(yù)防、金融分析、教育變革,也運(yùn)用于社會(huì)監(jiān)控和預(yù)測(cè)、治安管理、恐怖主義打擊等等方面。
運(yùn)用大量數(shù)據(jù)進(jìn)行犯罪偵查和控制始于1994年紐約市的警察部門(mén)啟用的一個(gè)新的治安信息管理系統(tǒng),即CompStat(Computer Statistics的縮寫(xiě))。CompStat是通過(guò)比較數(shù)據(jù)統(tǒng)計(jì)報(bào)告為基礎(chǔ)來(lái)確定警力資源分配、犯罪預(yù)防和打擊對(duì)策[5]。大數(shù)據(jù)時(shí)代的到來(lái),西方更是著力建構(gòu)大數(shù)據(jù)驅(qū)動(dòng)的犯罪偵查和控制體系。大數(shù)據(jù)驅(qū)動(dòng)犯罪偵查和控制體系利用大數(shù)據(jù)幫助警察分析歷史案件、發(fā)現(xiàn)犯罪趨勢(shì)和犯罪模式;通過(guò)分析城市數(shù)據(jù)源和社交網(wǎng)絡(luò)數(shù)據(jù),預(yù)測(cè)犯罪;利用大數(shù)據(jù),優(yōu)化警力資源分配,從而提高社會(huì)和公眾安全水平[6]。大數(shù)據(jù)已使犯罪偵查和控制模式發(fā)生根本性變革,利用大數(shù)據(jù)提升犯罪偵查和控制能力是未來(lái)的發(fā)展方向。
公安部部長(zhǎng)郭聲琨強(qiáng)調(diào)要大力加強(qiáng)大數(shù)據(jù)時(shí)代提升維護(hù)公共安全和服務(wù)人民群眾的能力和水平[7]。我國(guó)各級(jí)公安機(jī)關(guān)已開(kāi)始有意識(shí)運(yùn)用大數(shù)據(jù)推動(dòng)犯罪偵查和控制。然而大數(shù)據(jù)不僅是一個(gè)技術(shù)問(wèn)題,也帶來(lái)了偵查理念、方式、機(jī)制的變革。我國(guó)學(xué)界的研究集中在大數(shù)據(jù)技術(shù)應(yīng)用研究,對(duì)大數(shù)據(jù)帶來(lái)的偵查理念、方式、機(jī)制的變革的研究偏少,也不夠深入,迫切需要更為系統(tǒng)的、深入的研究。
一、復(fù)雜的犯罪態(tài)勢(shì)與大數(shù)據(jù)時(shí)代犯罪的數(shù)據(jù)化生態(tài)
當(dāng)下,犯罪呈現(xiàn)出更加嚴(yán)峻和復(fù)雜的態(tài)勢(shì)。首先是犯罪總量大,犯罪率逐年上升。據(jù)統(tǒng)計(jì),僅2012年公安機(jī)關(guān)刑事案件立案的案件數(shù)為6551440起,檢察機(jī)關(guān)批捕、決定逮捕犯罪嫌疑人的案件數(shù)為680539,人數(shù)為986056[8]。近二十多年來(lái),中國(guó)犯罪率呈逐年上升趨勢(shì),刑事案件立案數(shù)平均每年增長(zhǎng)22%以上,超過(guò)了全國(guó)GDP的增長(zhǎng)。①其次是犯罪智能化。犯罪是一種社會(huì)存在,科學(xué)的發(fā)展?jié)B透到犯罪的方方面面,提升了其能力和危害程度。這表現(xiàn)為兩個(gè)方面:一是運(yùn)用科學(xué)思維實(shí)施的犯罪,主要表現(xiàn)為犯罪思維嚴(yán)密,犯罪前經(jīng)過(guò)周密部署和策劃,犯罪過(guò)程滲透著科學(xué)思維和謀略。二是利用科學(xué)技術(shù)實(shí)施的犯罪,突出表現(xiàn)為數(shù)字化犯罪。以利用網(wǎng)絡(luò)犯罪為例,2012年,全國(guó)公安機(jī)關(guān)累計(jì)破獲涉網(wǎng)違法犯罪案件11.8萬(wàn)余起,抓獲犯罪嫌疑人21.6萬(wàn)余人。據(jù)賽門(mén)鐵克公司2012年9月發(fā)布的諾頓安全報(bào)告估算,2011年7月至2012年7月,中國(guó)有超過(guò)2.57億人成為網(wǎng)絡(luò)違法犯罪的受害者。網(wǎng)絡(luò)違法犯罪所造成的直接經(jīng)濟(jì)損失達(dá)2890億元人民幣,受害者人均蒙受的直接經(jīng)濟(jì)損失約1200元人民幣[9]。第三,犯罪時(shí)空的復(fù)雜性?,F(xiàn)代科技的發(fā)展,使得犯罪時(shí)間非線性,犯罪空間缺席性,時(shí)空組合的多維、多樣化和任意性[10]。第四,案件因果聯(lián)系復(fù)雜。相對(duì)于傳統(tǒng)的靜態(tài)、單一社會(huì)來(lái)說(shuō),現(xiàn)代社會(huì)是一個(gè)動(dòng)態(tài)、復(fù)雜社會(huì)。在動(dòng)態(tài)、復(fù)雜社會(huì)中,因果聯(lián)系具有非線性、偶合性、多因性、斷裂性,犯罪的因果聯(lián)系往往難以確定。
計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)的發(fā)展,使得當(dāng)下社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代。大數(shù)據(jù)時(shí)代首先是數(shù)據(jù)記錄時(shí)代。在數(shù)據(jù)記錄時(shí)代,數(shù)據(jù)記錄成為默認(rèn)模式[11],人類社會(huì)處在被無(wú)所不在各種各樣傳感器和微處理器構(gòu)成“萬(wàn)維觸角”的數(shù)據(jù)網(wǎng)絡(luò)記錄之下,手機(jī)、網(wǎng)絡(luò)、監(jiān)控探頭、射頻技術(shù)等等無(wú)所不在地記錄著我們的行為乃至我們的思想?!霸缟铣鲩T(mén),電梯的攝像頭記錄著我們的出行時(shí)間;開(kāi)車上班,道路的攝像頭記錄著我們的位置和車速;工作期間,網(wǎng)頁(yè)記錄著我們的瀏覽習(xí)慣和搜索記錄,電話記錄著我們的聯(lián)網(wǎng)對(duì)象和通話時(shí)長(zhǎng);下班回家,購(gòu)物記錄界定著我們的職業(yè)身份、家庭背景甚至性格特征,電視機(jī)頂盒記錄著我們的收視習(xí)慣和價(jià)值品位……”[12]“在數(shù)字世界里,我們都會(huì)留下電子‘腳印’或電子‘指紋’。”[13]20“我們正處于一種不斷變化卻日趨緊密的被監(jiān)視狀態(tài)中。事實(shí)上,現(xiàn)在我們的一舉一動(dòng)都能在某個(gè)數(shù)據(jù)庫(kù)中找到線索?!盵14]12
狡猾的犯罪者能有例外而成為“數(shù)據(jù)隱士”嗎?要成為“數(shù)據(jù)隱士”,意味著你要完全脫離現(xiàn)代社會(huì)系統(tǒng),不僅不能使用數(shù)字化產(chǎn)品,還要完全意義上不食“人間煙火”。因?yàn)楝F(xiàn)代社會(huì)幾乎被數(shù)據(jù)化了,一旦你與現(xiàn)代社會(huì)系統(tǒng)進(jìn)行交換,就很有可能被數(shù)據(jù)捕捉和記錄。然而,這并不是說(shuō)犯罪者的具體犯罪的任何要素或片段如犯罪時(shí)間、犯罪空間、犯罪行為、犯罪工具等等都會(huì)直接且完整無(wú)缺被數(shù)據(jù)記錄和儲(chǔ)存;而是說(shuō)犯罪者隱藏的犯罪信息總是被相關(guān)的海量數(shù)據(jù)從不同的側(cè)面記錄著,即便是某些甚至是主要或關(guān)鍵的犯罪要素或片段缺失,也可以通過(guò)不同側(cè)面相關(guān)海量數(shù)據(jù)聯(lián)接、分析,拼接或描畫(huà)出犯罪過(guò)程。因此,在大數(shù)據(jù)時(shí)代,不要說(shuō)數(shù)字化犯罪,即使傳統(tǒng)手段的犯罪,都可以說(shuō)落入了一種“天網(wǎng)恢恢,疏而不漏”的網(wǎng)絡(luò)記錄和存儲(chǔ)體系,數(shù)據(jù)化就是當(dāng)下犯罪的現(xiàn)實(shí)生態(tài)。
二、大數(shù)據(jù)驅(qū)動(dòng)的偵查模式是時(shí)代的必然選擇
模式指經(jīng)過(guò)提煉和抽象的標(biāo)準(zhǔn)樣式。偵查模式反映了偵查要素的結(jié)構(gòu)關(guān)系和運(yùn)行邏輯。偵查模式可以按照不同的標(biāo)準(zhǔn)進(jìn)行分類。學(xué)界按照偵查是否運(yùn)用信息科技手段,把偵查模式分為傳統(tǒng)的偵查模式、信息主導(dǎo)偵查模式。然而,如果從信息論的視角來(lái)看,傳統(tǒng)偵查模式與信息主導(dǎo)偵查模式的本質(zhì)區(qū)別不是是否運(yùn)用信息,而是信息記錄、存儲(chǔ)、提取以及分析方式上的根本差別。按照偵查所能運(yùn)用信息的記錄、存儲(chǔ)、提取以及分析方式,可以把偵查模式劃分為傳統(tǒng)偵查模式、業(yè)務(wù)信息主導(dǎo)的偵查模式和大數(shù)據(jù)驅(qū)動(dòng)的偵查模式。學(xué)界一般將業(yè)務(wù)信息主導(dǎo)的偵查模式和大數(shù)據(jù)驅(qū)動(dòng)的偵查模式合稱為信息主導(dǎo)偵查模式,但兩者之間不僅是發(fā)展階段上的差異(大數(shù)據(jù)驅(qū)動(dòng)的偵查模式是在業(yè)務(wù)信息主導(dǎo)偵查的基礎(chǔ)上發(fā)展起來(lái)的),而且在信息類型、信息提取和研判方式上也有根本差異,最重要的是由此差異而帶來(lái)偵查理念、特征和機(jī)制上的根本變革。
傳統(tǒng)偵查模式是在信息存儲(chǔ)、提取和分析上幾乎沒(méi)有什么科技含量的模式。傳統(tǒng)社會(huì),人類對(duì)信息的記錄和存儲(chǔ)方式主要是人的大腦和書(shū)寫(xiě)體系(傳統(tǒng)社會(huì)由于信息記錄的需要發(fā)展出一整套書(shū)寫(xiě)體系,由此而產(chǎn)生了許許多多按時(shí)間匯集的分門(mén)別類的書(shū)寫(xiě)檔案庫(kù))。對(duì)于犯罪的信息記錄來(lái)說(shuō),除了大腦和書(shū)寫(xiě)檔案外,犯罪現(xiàn)場(chǎng)也以物質(zhì)交換的形式記錄著犯罪信息。因此,傳統(tǒng)的偵查主要手段是調(diào)查訪問(wèn)(對(duì)大腦儲(chǔ)存的信息提取)、書(shū)寫(xiě)檔案的查詢。②人腦信息的存儲(chǔ)和提取的特點(diǎn)是:分散在不同的人身上;信息的準(zhǔn)確性差,受到外在環(huán)境和信息儲(chǔ)存者自身感受能力、記憶能力等影響;信息缺乏穩(wěn)定性,信息量和準(zhǔn)確性隨著時(shí)間變化而衰減;信息能否提取以及提取的質(zhì)量,首先取決于能否找到儲(chǔ)存信息的人,其次取決于偵查人員的詢問(wèn)技術(shù)(經(jīng)驗(yàn))、被詢問(wèn)人表達(dá)能力、情緒、配合態(tài)度等等多種因素。書(shū)寫(xiě)檔案記錄信息的優(yōu)點(diǎn)是準(zhǔn)確性高、穩(wěn)定性強(qiáng),但其有兩個(gè)重大缺陷:一是提取困難。人們要找到其中一點(diǎn)有用信息,就得把所有的資料翻閱一遍;盡管后來(lái)建立了圖書(shū)館式的目錄索引,但查找起來(lái)依然耗時(shí)費(fèi)力。二是不能提供直接的犯罪信息。書(shū)寫(xiě)檔案不可能是犯罪的實(shí)時(shí)記錄,只可能是犯罪破獲后一種事后登記,因此這種檔案對(duì)于需要破獲的犯罪來(lái)說(shuō),不能提供直接的犯罪信息。傳統(tǒng)偵查的信息分析研判主要依靠偵查人員的經(jīng)驗(yàn),有經(jīng)驗(yàn)的偵查人員往往成為是否破案的關(guān)鍵。總之,這種模式科技含量低、粗放型特征突出,能否破案主要取決于偵查人員的經(jīng)驗(yàn)和投入的人力多少,不僅如此,還取決于偵查人員的運(yùn)氣。這對(duì)于傳統(tǒng)靜態(tài)、單一的社會(huì)及其犯罪也許能夠適應(yīng),而與動(dòng)態(tài)、復(fù)雜的社會(huì)及其犯罪幾乎完全不匹配。
業(yè)務(wù)信息主導(dǎo)偵查模式是在信息技術(shù)引領(lǐng)下的以業(yè)務(wù)信息存儲(chǔ)、提取和研判為基礎(chǔ)的偵查模式。隨著信息技術(shù)的發(fā)展,各種各樣信息記錄和存儲(chǔ)設(shè)備被廣泛使用。信息記錄和存儲(chǔ)不再完全依賴人腦和書(shū)寫(xiě)檔案,而是電子化的記錄,存儲(chǔ)設(shè)備成為人類記錄和存儲(chǔ)信息的主要方式。這些設(shè)備代替人腦和書(shū)寫(xiě)檔案實(shí)時(shí)記錄著人類的行為,也記錄了犯罪行為。所記錄和存儲(chǔ)的信息從來(lái)源和存儲(chǔ)分布來(lái)看,形成于不同的業(yè)務(wù)經(jīng)營(yíng)并分布儲(chǔ)存在不同的業(yè)務(wù)信息庫(kù)中,如商家記錄和存儲(chǔ)人們的消費(fèi)信息、銀行記錄和存儲(chǔ)了人們的金融交易信息、醫(yī)院記錄病人信息等等。這些信息庫(kù)缺乏整合,相互之間形成信息孤島,信息冗余和信息孤島成為信息存在的基本生態(tài)。就業(yè)務(wù)信息主導(dǎo)偵查模式來(lái)說(shuō),其主要特征是:一是偵查部門(mén)依賴于公安平臺(tái)所累積的結(jié)構(gòu)化的數(shù)據(jù)庫(kù)主要用于人、事、物的核查、比對(duì),實(shí)時(shí)犯罪信息仍然主要依靠人工采集。二是信息提取依然困難。不可否認(rèn),相比傳統(tǒng)偵查模式,業(yè)務(wù)信息主導(dǎo)的偵查模式針對(duì)公安機(jī)關(guān)所累積結(jié)構(gòu)化信息來(lái)說(shuō),確實(shí)大大提高了查詢、比對(duì)效率,但是面對(duì)越來(lái)越多地被累積的不同來(lái)源、不同結(jié)構(gòu)的數(shù)據(jù),尤其是大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),既缺乏數(shù)據(jù)整合的技術(shù)和機(jī)制,也缺乏信息提取的技術(shù)手段。結(jié)構(gòu)化數(shù)據(jù)是先有模型后有數(shù)據(jù),大多具有事后登記的性質(zhì)(也有少量的實(shí)時(shí)記錄的數(shù)據(jù)如旅館住宿等),很難有實(shí)時(shí)犯罪行為記錄信息,其主要價(jià)值在于對(duì)人、事、物的核查;而正是不同來(lái)源的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)中實(shí)時(shí)記錄了犯罪的“蛛絲馬跡”。三是信息分析、研判仍然主要依靠偵查人員的經(jīng)驗(yàn)。業(yè)務(wù)信息系統(tǒng)主要用于簡(jiǎn)單的查詢、比對(duì),但是不能進(jìn)行智能化的算法分析。總的來(lái)說(shuō),這種偵查模式面對(duì)當(dāng)下的犯罪態(tài)勢(shì),尤其是流動(dòng)性犯罪、數(shù)字化犯罪等,難有成效。
大數(shù)據(jù)驅(qū)動(dòng)偵查模式是建立在大數(shù)據(jù)和云計(jì)算平臺(tái)的基礎(chǔ)上,是大數(shù)據(jù)時(shí)代的信息主導(dǎo)偵查模式的升級(jí)換代。在大數(shù)據(jù)時(shí)代,大數(shù)據(jù)驅(qū)動(dòng)的偵查模式是一種時(shí)代的必然選擇,這不僅在于復(fù)雜的犯罪態(tài)勢(shì)及其數(shù)據(jù)化生態(tài),更在于大數(shù)據(jù)技術(shù)使得這種選擇成為現(xiàn)實(shí)。
首先,犯罪的數(shù)據(jù)化生態(tài)是大數(shù)據(jù)驅(qū)動(dòng)偵查模式的現(xiàn)實(shí)基礎(chǔ)。面對(duì)當(dāng)下復(fù)雜的犯罪態(tài)勢(shì),人們似乎有點(diǎn)不知所措。犯罪的控制某種程度上是一種偵查技術(shù)對(duì)犯罪技術(shù)保持優(yōu)勢(shì)。然而現(xiàn)代性的發(fā)展使犯罪者具有更強(qiáng)的匿名性、流動(dòng)性等,從而一度打破了公安機(jī)關(guān)曾經(jīng)具有的優(yōu)勢(shì),這也是如今犯罪爆發(fā)性增長(zhǎng)的原因之一。然而犯罪作為一種社會(huì)存在,當(dāng)社會(huì)成就犯罪條件時(shí),也會(huì)給人類提供制約其的機(jī)會(huì)。犯罪的數(shù)據(jù)化生態(tài)根本改變了犯罪信息的記錄和存儲(chǔ)方式,極大擴(kuò)大了“社會(huì)記憶”,大數(shù)據(jù)技術(shù)將徹底改變偵查技術(shù)與犯罪技術(shù)之間的對(duì)比關(guān)系。因此,我們必須改換傳統(tǒng)的偵查模式,采用大數(shù)據(jù)驅(qū)動(dòng)偵查模式以控制犯罪和打擊犯罪。
其次,在大數(shù)據(jù)時(shí)代,偵查所面對(duì)和所能處理的數(shù)據(jù)不再是小數(shù)據(jù),而是大數(shù)據(jù)。如今,偵查所面對(duì)和所能處理的數(shù)據(jù)具有體量大、類型多、價(jià)值密度低的特征?!俺靥痢焙汀按蠛!弊钊菀装l(fā)現(xiàn)的區(qū)別就是規(guī)模[15]。過(guò)去偵查,即使是業(yè)務(wù)信息主導(dǎo)偵查階段,所面對(duì)或所能處理的數(shù)據(jù)量相當(dāng)于“池塘”,而與此相對(duì)照,現(xiàn)代偵查所面對(duì)和能處理的數(shù)據(jù)量則是“大?!?。不僅如此,現(xiàn)代偵查所面對(duì)的則是數(shù)據(jù)的多樣性:從結(jié)構(gòu)上看,不僅有結(jié)構(gòu)化數(shù)據(jù),還有大量半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);從數(shù)據(jù)類型看,有業(yè)務(wù)數(shù)據(jù)、用戶原創(chuàng)數(shù)據(jù)、傳感器感知數(shù)據(jù);從數(shù)據(jù)表現(xiàn)形式看,有文字、圖片、音頻、視頻、鏈接等;從犯罪案件構(gòu)成角度看,有人及其關(guān)系、行為、物、時(shí)間、空間和主觀意圖數(shù)據(jù)。數(shù)據(jù)的價(jià)值密度低。在巨量的數(shù)據(jù)中,有關(guān)犯罪數(shù)據(jù)混雜其間,僅僅是其中小小的“浪花”,但其彌足珍貴。以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒[16]。
第三,大數(shù)據(jù)技術(shù)能從海量的數(shù)據(jù)中對(duì)犯罪信息進(jìn)行提取、分析研判以及預(yù)測(cè)未來(lái)。大數(shù)據(jù)是其規(guī)模或復(fù)雜程度超出了常用技術(shù)按照合理的成本和時(shí)限捕捉、處理的數(shù)據(jù)。而以云計(jì)算為依托的大數(shù)據(jù)技術(shù)可以突破常規(guī)技術(shù)成本和時(shí)限的要求。具體來(lái)說(shuō),其一,大數(shù)據(jù)技術(shù)能適時(shí)提取和分析處理多結(jié)構(gòu)多源數(shù)據(jù),尤其是半結(jié)構(gòu)和非結(jié)構(gòu)化的數(shù)據(jù),能夠從海量的、雜亂無(wú)章的數(shù)據(jù)中抽取出大量的與犯罪相關(guān)的細(xì)節(jié)、點(diǎn)滴片斷、不同側(cè)面數(shù)據(jù)、信息,并且能把“數(shù)據(jù)聯(lián)系起來(lái)、信息點(diǎn)連接起來(lái)、片斷串聯(lián)起來(lái)”[13]29-30,從而能將表面看來(lái)毫無(wú)意義、互不關(guān)聯(lián)的數(shù)據(jù)碎片拼出一幅清晰完整的犯罪圖畫(huà)。而對(duì)于確定一個(gè)犯罪嫌疑人的身份來(lái)說(shuō),也許只需要四個(gè)信息點(diǎn)就足夠了。其二,大數(shù)據(jù)以云計(jì)算為依托,能夠在合理時(shí)間內(nèi)進(jìn)行信息提取和分析。以周克華案件為例,南京警方動(dòng)用上百名警力花費(fèi)了數(shù)天時(shí)間對(duì)視頻監(jiān)控?cái)?shù)據(jù)進(jìn)行人肉搜索,而運(yùn)用大數(shù)據(jù)技術(shù)也許只要幾個(gè)小時(shí)就足夠了。其三,大數(shù)據(jù)技術(shù),一個(gè)最為根本的突破是能夠運(yùn)用海量數(shù)據(jù)進(jìn)行算法分析,進(jìn)行信息研判,從而幫助我們認(rèn)識(shí)過(guò)去,分析原因,揭示犯罪發(fā)生的規(guī)律。最后,大數(shù)據(jù)能在分析過(guò)去中尋找有意義的模式,從而預(yù)測(cè)未來(lái),為我們優(yōu)化警力資源配置、打擊犯罪提供先機(jī)。
三、大數(shù)據(jù)驅(qū)動(dòng)的偵查模式的理念變革
黑格爾指出,“理念是任何一門(mén)學(xué)問(wèn)的理性”[17],并認(rèn)為理念中包含著“某種預(yù)想的東西”,具有前瞻性、導(dǎo)向性和設(shè)計(jì)性[18]。偵查模式轉(zhuǎn)換首先是理念轉(zhuǎn)換。偵查模式中的理念就是指貫穿在偵查模式中反映了偵查規(guī)律的并具有引導(dǎo)、支配、決定偵查活動(dòng)的觀點(diǎn)、看法、信念。大數(shù)據(jù)驅(qū)動(dòng)偵查模式不僅是一種新的工作模式,更是一種新思維、新理念。在大數(shù)據(jù)時(shí)代,偵查要確立的理念有:
在線、開(kāi)放的理念。大數(shù)據(jù)首先是在線數(shù)據(jù)。大數(shù)據(jù)不僅是體量大,更是實(shí)時(shí)記錄社會(huì)的復(fù)雜動(dòng)態(tài)數(shù)據(jù):用戶原創(chuàng)和各種傳感器感知數(shù)據(jù),而正是這些數(shù)據(jù)混雜了犯罪的“蛛絲馬跡”。對(duì)于偵查來(lái)說(shuō),公安大平臺(tái)累積的結(jié)構(gòu)化數(shù)據(jù)是重要的,尤其是對(duì)人、事、物的核查具有重要價(jià)值,但是很難有實(shí)時(shí)的犯罪記錄。大數(shù)據(jù)驅(qū)動(dòng)的偵查就是在公安大平臺(tái)累積的結(jié)構(gòu)化數(shù)據(jù)的基礎(chǔ)上,對(duì)不斷變動(dòng)用戶原創(chuàng)和各種傳感器感知數(shù)據(jù)進(jìn)行提取、分析和處理,獲取信息。因此,對(duì)于大數(shù)據(jù)驅(qū)動(dòng)的偵查,我們必須堅(jiān)持在線和開(kāi)放的數(shù)據(jù)理念,以獲得我們需要的海量數(shù)據(jù),進(jìn)而分析、處理這些數(shù)據(jù)。
數(shù)據(jù)主導(dǎo)偵查理念。大數(shù)據(jù)時(shí)代,數(shù)據(jù)是犯罪的生態(tài),偵查過(guò)程就是數(shù)據(jù)儲(chǔ)存、提取和分析過(guò)程,數(shù)據(jù)貫穿于偵查的各個(gè)環(huán)節(jié),“讓數(shù)據(jù)說(shuō)話”成為偵查的基本思維。數(shù)據(jù)主導(dǎo)偵查的理念至少包括以下三個(gè)方面的內(nèi)容:首先,有關(guān)犯罪的一切現(xiàn)象皆可數(shù)據(jù)化。凡事皆可量化,皆可數(shù)據(jù)化[19]25-26。不僅與犯罪相關(guān)的有形之物如時(shí)間、空間、人的特征(生物識(shí)別特征、行為習(xí)慣等)、行為、手段、物等可以量化和數(shù)據(jù)化,那些與犯罪相關(guān)的無(wú)形之物如人的價(jià)值觀念、態(tài)度、情緒等等也可以量化和數(shù)據(jù)化。其次,大數(shù)據(jù)是偵查的基礎(chǔ)資源,是偵查的工具箱。偵查就是對(duì)數(shù)據(jù)開(kāi)礦式的挖掘和分析,偵查能否成功某種程度上取決于對(duì)大數(shù)據(jù)資源的提取、分析能力;運(yùn)用大數(shù)據(jù)各種分析技術(shù),可以獲得我們所需要的犯罪信息。最后,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)居于偵查過(guò)程的核心地位,支配著偵查的運(yùn)行。犯罪現(xiàn)場(chǎng)重建、偵查決策、偵查途徑的選擇、偵查分析、數(shù)據(jù)摸排、偵查預(yù)測(cè)等等無(wú)不圍繞數(shù)據(jù)運(yùn)行。
相關(guān)性理念。大數(shù)據(jù)是通過(guò)量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系來(lái)確定相關(guān)關(guān)系。相關(guān)關(guān)系強(qiáng),是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能隨之增加[3]71。傳統(tǒng)偵查,是按照因果關(guān)系和數(shù)據(jù)結(jié)構(gòu)的標(biāo)準(zhǔn)③來(lái)采集數(shù)據(jù)和分析數(shù)據(jù)。到大數(shù)據(jù)時(shí)代,我們能分析、運(yùn)用幾乎所有相關(guān)數(shù)據(jù),收集數(shù)據(jù)不必再拘泥于因果關(guān)系和數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn),而是堅(jiān)持相關(guān)性標(biāo)準(zhǔn),不僅采集結(jié)構(gòu)化數(shù)據(jù),還要采集半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這種相關(guān)關(guān)系雖然不能直接揭示內(nèi)在的因果關(guān)系,但是對(duì)于犯罪偵查和控制來(lái)說(shuō),其展現(xiàn)的相關(guān)關(guān)系仍具有較強(qiáng)的效用價(jià)值。
相關(guān)關(guān)系能讓偵查人員全方位、多角度地思考分析案情。相關(guān)關(guān)系雖然不追求精確性,但是其追求豐富性,不拒絕任何機(jī)會(huì),盡可能去創(chuàng)造和利用機(jī)會(huì)。通過(guò)相關(guān)關(guān)系,才能將看起來(lái)沒(méi)有聯(lián)系的信息內(nèi)在地聯(lián)系起來(lái),從而更為全面地認(rèn)識(shí)案件情況。這也許可以幫助我們發(fā)現(xiàn)破案線索,理清破案思路,劃定偵破范圍。
相關(guān)關(guān)系可以給我們進(jìn)一步確定因果關(guān)系以指引,從而確定犯罪原因和證明犯罪。相關(guān)關(guān)系的分析是分析因果關(guān)系的基礎(chǔ)。相關(guān)關(guān)系并不必然是因果關(guān)系,但因果關(guān)系必然是高度相關(guān)關(guān)系。通過(guò)相關(guān)關(guān)系,我們可以進(jìn)一步探究其中是否存在因果關(guān)系,從而證明犯罪。
相關(guān)關(guān)系的一個(gè)重要價(jià)值是可以監(jiān)控犯罪情勢(shì)。如上所述,當(dāng)下影響犯罪的原因是紛繁復(fù)雜的,要確定犯罪發(fā)生的原因相當(dāng)不容易甚至不可能。對(duì)于偵查人員來(lái)說(shuō),重要的也許不是去理清犯罪原因,而是控制犯罪。通過(guò)相關(guān)關(guān)系,確定關(guān)聯(lián)物,進(jìn)而可以監(jiān)控犯罪情勢(shì),從而使我們有效配置警力資源,打擊犯罪。
通過(guò)相關(guān)關(guān)系,可以預(yù)測(cè)犯罪。大數(shù)據(jù)的核心價(jià)值是預(yù)測(cè)。通過(guò)收集具有相關(guān)關(guān)系的數(shù)據(jù),建立大數(shù)據(jù)模型,我們可以從微觀上預(yù)測(cè)什么時(shí)間、什么地點(diǎn)、什么人、什么類型等等的犯罪容易發(fā)生,也可以從宏觀上預(yù)測(cè)犯罪趨勢(shì),這為我們防范和打擊犯罪提供了更好的機(jī)會(huì)。
線上破案與線下證明相結(jié)合的理念。大數(shù)據(jù)使得發(fā)現(xiàn)和確定某一犯罪嫌疑人似乎變得相當(dāng)容易。但是數(shù)據(jù)只是事實(shí)的鏡像,并不等于就是事實(shí);④而且大數(shù)據(jù)的算法邏輯(強(qiáng)調(diào)相關(guān)關(guān)系、確定的只是一種概率,甚至由于噪音等因素會(huì)出現(xiàn)致命的誤差)與法律證明邏輯(強(qiáng)調(diào)因果關(guān)系和排除合理懷疑標(biāo)準(zhǔn))存在差異,因此,犯罪偵查尚需要進(jìn)一步按照法律體系的操作要求進(jìn)行證明。即使我們通過(guò)大數(shù)據(jù)可以確定犯罪嫌疑人,達(dá)到了排除合理懷疑的標(biāo)準(zhǔn),我們也必須把大數(shù)據(jù)的算法體系轉(zhuǎn)化為符合法律規(guī)范要求的證明體系,把數(shù)據(jù)確定轉(zhuǎn)換為法律確定。然而,線上破案和線下證明并不是割裂的,大數(shù)據(jù)能對(duì)我們證明起引導(dǎo)作用,幫助我們尋找證據(jù),確定因果關(guān)系。因此,在大數(shù)據(jù)時(shí)代我們既不能拋棄相關(guān)關(guān)系,只追求因果關(guān)系,也要必須防止用相關(guān)關(guān)系代替因果關(guān)系,防止用預(yù)測(cè)來(lái)代替事實(shí)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11