
大數(shù)據(jù)時(shí)代的意圖搜索
意圖搜索起源于互聯(lián)網(wǎng)搜索引擎,是基于互聯(lián)網(wǎng)上海量的無(wú)組織、異構(gòu)、動(dòng)態(tài)的數(shù)據(jù)與信息環(huán)境下搜索引擎不能準(zhǔn)確理解用戶的搜索意圖而提出的,利用如神經(jīng)網(wǎng)絡(luò)算法等機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)智能化的自動(dòng)搜索,從而更加精準(zhǔn)、主體的提供個(gè)性化的服務(wù)。
一、目的意義
大數(shù)據(jù)時(shí)代,任何網(wǎng)絡(luò)行為所留下的“蛛絲馬跡”都以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,正所謂“存在就有痕跡,聯(lián)系就有信息”,通過(guò)應(yīng)用物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù),構(gòu)建網(wǎng)絡(luò)空間中行為事件、思想事件等模型。在實(shí)體空間和虛擬空間中全面收集、甄別、過(guò)濾、分類(lèi)、整合人的存在痕跡和聯(lián)系信息,關(guān)注人物或事件間聯(lián)系鏈,從而實(shí)現(xiàn)網(wǎng)絡(luò)空間中存在的各種意圖,完成對(duì)意圖產(chǎn)生源頭、傳播途徑和發(fā)展趨勢(shì)的全方位描述,達(dá)到對(duì)個(gè)人和組織的所思所想行為所在的全面搜索和分析。做到提前預(yù)警、智能決策。
2013年的“棱鏡門(mén)”事件為國(guó)家安全敲響警鐘的同時(shí)我們也看到正是有了“大數(shù)據(jù)”的存在,才讓“棱鏡”項(xiàng)目得以實(shí)施。目前,我國(guó)面臨的安全形勢(shì)嚴(yán)峻,反恐問(wèn)題更是當(dāng)前國(guó)際面臨的重要安全問(wèn)題,大數(shù)據(jù)環(huán)境下的意圖搜索將能積極應(yīng)對(duì)新時(shí)期各種安全威脅,運(yùn)用大數(shù)據(jù)技術(shù)和人工智能技術(shù)進(jìn)行深入分析,實(shí)現(xiàn)對(duì)安全事件的準(zhǔn)確識(shí)別和提前預(yù)警,有力提升我國(guó)基于大數(shù)據(jù)的國(guó)家安全防護(hù)能力。
二、關(guān)鍵技術(shù)
1、人工智能技術(shù):意圖搜索引擎構(gòu)建了人與信息的意識(shí)主動(dòng)化的連接,通過(guò)不斷的交換學(xué)習(xí),形成模擬人腦的智能系統(tǒng),從而實(shí)現(xiàn)人與機(jī)器的相互了解,因此人工智能技術(shù)將是意圖所搜的核心技術(shù)。主要相關(guān)的人工智能技術(shù)有:機(jī)器深度學(xué)習(xí)、計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)、腦機(jī)接口、自然語(yǔ)言處理等技術(shù)。
2、大數(shù)據(jù)技術(shù):而對(duì)數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、處理、挖掘分析是搜索技術(shù)的基本環(huán)節(jié),因此以數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘等技術(shù)為主的大數(shù)據(jù)技術(shù)也是意圖搜索的關(guān)鍵技術(shù)之一。主要相關(guān)的大數(shù)據(jù)技術(shù)有:數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)挖掘與分析技術(shù)等。
3、物聯(lián)網(wǎng)技術(shù):隨著傳感器的發(fā)展和移動(dòng)化的能力,意圖搜索也呈現(xiàn)多樣化的形態(tài)。因此,以傳感器技術(shù)為主的物聯(lián)網(wǎng)技術(shù)也是意圖搜索的關(guān)鍵技術(shù)之一。
4、其他信息技術(shù):此外,搜索實(shí)現(xiàn)從傳統(tǒng)搜索到人工智能的過(guò)渡,還需要分詞技術(shù)、硬件存儲(chǔ)、云計(jì)算、超級(jí)計(jì)算、知識(shí)圖譜等相關(guān)技術(shù)的成熟。
三、目標(biāo)成果
大數(shù)據(jù)環(huán)境下的意圖搜索技術(shù)將是構(gòu)建一個(gè)構(gòu)建虛擬空間信息社會(huì)雷達(dá)系統(tǒng)。該系統(tǒng)的主體是搭建一個(gè)完整的知識(shí)庫(kù),開(kāi)發(fā)意圖搜索引擎系統(tǒng)、并構(gòu)建云計(jì)算與大數(shù)據(jù)的基礎(chǔ)設(shè)施平臺(tái)。搜索引擎系統(tǒng):搜集器、控制器、索引器、檢索器、用戶接口、處理分析系統(tǒng)
技術(shù)成果:人工智能、智能推理及知識(shí)研發(fā)、信息提取與分析技術(shù)、虛擬化工具、系統(tǒng)運(yùn)行保障研發(fā)、系統(tǒng)算法、信息檢索能力研發(fā)等技術(shù)上的突破成果。
四、國(guó)內(nèi)外狀況
1、美國(guó)
(1)美國(guó)技術(shù)優(yōu)勢(shì)明顯
以微軟和Google為代表的互聯(lián)網(wǎng)巨頭技術(shù)和應(yīng)用皆處于領(lǐng)先地位。微軟亞洲研究院的人立方關(guān)系搜索提供的搜索結(jié)果中,將所有信息都按照“人”進(jìn)行重新整合,以人與人之間的關(guān)系為紐帶,將埋藏在網(wǎng)絡(luò)信息海洋中的“人”的信息連接匯總,圖文并茂地展現(xiàn)出來(lái),開(kāi)啟的意圖搜索的新篇章。棱鏡門(mén)事件以來(lái),NSA的全球監(jiān)控行為遭到各國(guó)政府和人民的譴責(zé),但美國(guó)情報(bào)部門(mén)所展現(xiàn)的大數(shù)據(jù)和信息安全技術(shù)實(shí)力不容忽視。Accumulo數(shù)據(jù)庫(kù)系統(tǒng)是NSA企業(yè)架構(gòu)的核心。大多數(shù)NSA的關(guān)鍵分析應(yīng)用都運(yùn)行在Accumulo上,從技術(shù)角度看,NSA已經(jīng)能夠識(shí)別網(wǎng)絡(luò)上的各種可疑行為和個(gè)人,可以說(shuō)美國(guó)政府在相關(guān)技術(shù)已走到了Google、微軟等互聯(lián)網(wǎng)巨頭之前。
(2)政府支持力度大
美國(guó)在相關(guān)技術(shù)的研發(fā)上給予高度重視。奧巴馬政府大數(shù)據(jù)研究和發(fā)展倡議中推出的 XDATA項(xiàng)目將在四年里耗費(fèi)2500萬(wàn)美元來(lái)開(kāi)發(fā)計(jì)算技術(shù)和防護(hù)數(shù)據(jù)軟件。2014年美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)啟動(dòng)其“大機(jī)理”項(xiàng)目,目的是發(fā)展可以發(fā)現(xiàn)隱藏在大數(shù)據(jù)中的因果關(guān)系模型。美國(guó)國(guó)防部每年投入2.5 億美元資助利用海量數(shù)據(jù)的新方法研究,并將傳感、感知和決策支持結(jié)合在一起,制造能自己運(yùn)行和做出決策的自治系統(tǒng),為軍事行動(dòng)提供更好的支持。NSA在大數(shù)據(jù)項(xiàng)目的規(guī)模、可擴(kuò)展性、安全性在很多方面甚至超過(guò)了Google、亞馬遜和蘋(píng)果這樣的大型互聯(lián)網(wǎng)企業(yè)。NSA旗下的風(fēng)險(xiǎn)投資公司In-Q-Tel迄今已經(jīng)投資了200多個(gè)云計(jì)算、大數(shù)據(jù)、搜索與分析創(chuàng)業(yè)項(xiàng)目。美國(guó)國(guó)土安全部正在開(kāi)展“可視化和數(shù)據(jù)分析卓越中心”項(xiàng)目,通過(guò)對(duì)大規(guī)模異構(gòu)數(shù)據(jù)的研究,使應(yīng)急救援人員能夠解決人為或自然災(zāi)害、恐怖主義事件、網(wǎng)絡(luò)威脅等方面的問(wèn)題。(參考文獻(xiàn):美國(guó)國(guó)防部的大數(shù)據(jù)安全戰(zhàn)略,大數(shù)據(jù)文摘)
(3)美軍利用大數(shù)據(jù)搜索提升偵查和反恐能力。
美軍正在開(kāi)發(fā)的新一代大數(shù)據(jù)系統(tǒng),能夠通過(guò)計(jì)算機(jī)的速度和精度以及人的敏捷性,來(lái)理解和解釋現(xiàn)實(shí)世界,協(xié)助指揮官和分析人員將以100倍于當(dāng)前的速度來(lái)理解傳感器收集的海量數(shù)據(jù)。例如,當(dāng)阿富汗境內(nèi)的大毒梟準(zhǔn)備為基地組織等恐怖分子提供資金時(shí),美軍的情報(bào)分析人員能夠借助大數(shù)據(jù)技術(shù),把作戰(zhàn)方案庫(kù)里的數(shù)據(jù)與有關(guān)基地組織情況庫(kù)里的資金數(shù)據(jù)進(jìn)行實(shí)時(shí)、自主關(guān)聯(lián),指導(dǎo)美軍先敵一步采取行動(dòng)。
在美國(guó)國(guó)防部的資助下,美國(guó)“記錄未來(lái)”公司,專(zhuān)門(mén)研究如何通過(guò)分析互聯(lián)網(wǎng)信息,特別是“臉譜”、“推特”等社交網(wǎng)站,預(yù)先察知恐怖襲擊等重大事件。2013年6月,美國(guó)國(guó)家安全局局長(zhǎng)兼美國(guó)賽博司令部司令亞歷山大在參加眾議院特設(shè)情報(bào)委員會(huì)聽(tīng)證會(huì)時(shí)承認(rèn),通過(guò)秘密進(jìn)行的“棱鏡”等監(jiān)視項(xiàng)目,美國(guó)政府至少挫敗了50起恐怖襲擊事件。這是大數(shù)據(jù)技術(shù)運(yùn)用的成功案例。(參考文獻(xiàn):戰(zhàn)爭(zhēng)步入大數(shù)據(jù)時(shí)代,中國(guó)青年報(bào),2014.03.14)
2、我國(guó)的發(fā)展現(xiàn)狀
在我國(guó)百度、搜狗、360等互聯(lián)網(wǎng)公司以及??低暤劝卜榔髽I(yè)處于技術(shù)和應(yīng)用的前沿。從整體上來(lái)看,在商業(yè)開(kāi)放和應(yīng)用方面尚具備一定的國(guó)際競(jìng)爭(zhēng)力,但從大數(shù)據(jù)智能搜索應(yīng)用于國(guó)家安全防護(hù)上來(lái)看,我國(guó)在此方面與美國(guó)尚存在著較大的差距。
意圖搜索最早起源于互聯(lián)網(wǎng)行業(yè),通過(guò)對(duì)傳統(tǒng)搜索引擎的智能化應(yīng)用擴(kuò)展,基于分類(lèi)算法對(duì)意圖分析和分析擴(kuò)展等功能進(jìn)行應(yīng)用,逐漸由搜索引擎學(xué)會(huì)判斷用戶的真實(shí)搜索意圖,實(shí)現(xiàn)智能搜索引擎。隨著全球安全形勢(shì)日趨惡化,意圖搜索逐漸與物聯(lián)網(wǎng)結(jié)合并落地,中國(guó)工程院吳曼青院士提出了反恐環(huán)境下基于大數(shù)據(jù)的意圖搜索的設(shè)想充分表明了安防行業(yè)已經(jīng)把意圖搜索概念提升到了主流產(chǎn)品形態(tài),充分做好了與意圖搜索技術(shù)結(jié)合的準(zhǔn)備工作。
一、意圖搜索起源意圖搜索最早起源于互聯(lián)網(wǎng)行業(yè)搜索引擎工具,隨著互聯(lián)網(wǎng)信息量的不斷增加,能夠快速、準(zhǔn)確地查找信息越來(lái)越困難,主要原因是搜索引擎不能理解用戶的真實(shí)查詢意圖,因而機(jī)器學(xué)習(xí)如遺傳算法、BP神經(jīng)網(wǎng)絡(luò)法等在這方面的應(yīng)用研究快速地被引起關(guān)注。Lam Wai 就利用基于事例的機(jī)器學(xué)習(xí)和查詢反饋技術(shù)實(shí)現(xiàn)了文本的自動(dòng)分類(lèi)并用于文本檢索, 實(shí)驗(yàn)證明了其優(yōu)越性。Mandala Rila 采用加權(quán)方法從多類(lèi)信息中實(shí)現(xiàn)查詢擴(kuò)展 , 以及Chakrabarti 探討的基于矩陣代數(shù)的主題提取算法、組合詞匯和索引文本等特征提取都是這方面的努力。但目前最有前景的是Doug Lenat 研制的搜索系統(tǒng), 通過(guò)建立常識(shí)庫(kù)和推理機(jī)來(lái)與用戶交談, 進(jìn)而實(shí)現(xiàn)對(duì)用戶真正意圖的理解。知識(shí)工程之父Feigenbaum稱(chēng)贊他開(kāi)創(chuàng)了查詢的“語(yǔ)義時(shí)代”(TheAgeof Semantics)。但前提是要建立一個(gè)龐大的百科全書(shū)常識(shí)庫(kù), 這是非常困難的, 而且也不分析用戶的潛在意圖。構(gòu)造龐大知識(shí)庫(kù)的一種方法是從網(wǎng)絡(luò)上自動(dòng)構(gòu)造, Craven 和Lesser 提出了信息獲取的系統(tǒng)原理, 知識(shí)庫(kù)的結(jié)構(gòu)和實(shí)現(xiàn)方法。Choi 則實(shí)現(xiàn)了一種具體的自動(dòng)構(gòu)造系統(tǒng),其可從網(wǎng)上發(fā)現(xiàn)文本并歸入本地?cái)?shù)據(jù)庫(kù)供查詢, 它相當(dāng)于智能代理。Alsaffa 做了類(lèi)似的探索, 利用專(zhuān)家系統(tǒng)在用戶喜歡的表達(dá)和系統(tǒng)要求的表達(dá)之間實(shí)現(xiàn)自動(dòng)轉(zhuǎn)換。意圖搜索正在基于這些技術(shù)之上實(shí)現(xiàn)了智能化的自動(dòng)搜索。雖然意圖搜索起源于互聯(lián)網(wǎng)行業(yè),但是目前已經(jīng)被廣泛用于其它行業(yè),例如在安防行業(yè)與物聯(lián)網(wǎng)技術(shù)緊密結(jié)合。
二、意圖搜索在互聯(lián)網(wǎng)行業(yè)的發(fā)展
互聯(lián)網(wǎng)行業(yè)最早由搜索引擎起步,目前數(shù)據(jù)也都是通過(guò)搜索引擎實(shí)現(xiàn)數(shù)據(jù)交換和傳遞過(guò)程。用戶之所以會(huì)產(chǎn)生搜索行為,往往是在解決任務(wù)時(shí)遇到自己不熟悉的概念或者問(wèn)題,由此產(chǎn)生了對(duì)特定信息的需求,之后用戶會(huì)在頭腦中逐步形成秒速需求的查詢?cè)~,將查詢提交給搜索引擎,然后對(duì)搜索結(jié)果進(jìn)行瀏覽,如果發(fā)現(xiàn)搜索結(jié)果不能完全解決用戶的信息需求,則會(huì)根據(jù)搜索結(jié)果的啟發(fā),改寫(xiě)查詢,以便更精確地描述自己的信息需求,之后重新構(gòu)造新的查詢需求,提交搜索引擎,如此形成用戶和搜素引擎交互的閉合回路,直到搜索結(jié)果已經(jīng)解決了自己的需求或嘗試幾次無(wú)果而終。
從上述過(guò)程可以看出,從用戶產(chǎn)生信息需求到最終形成用戶查詢,中間有很大的不確定性,用戶未必能夠一開(kāi)始就找到合適的查詢?cè)~,即使是找到了,也可能存在查詢?cè)~不能完全描述信息需求的情形,即在形成查詢的過(guò)程中存在信息丟失的問(wèn)題。所以后續(xù)循環(huán)中的查詢改寫(xiě)就是用戶逐步澄清搜索需求的一個(gè)過(guò)程。
用戶發(fā)出的每個(gè)搜索請(qǐng)求背后都隱含著潛在的搜索意圖,如果搜索引擎能夠根據(jù)查詢?cè)~匯自動(dòng)找出背后的用戶搜索意圖,然后針對(duì)不同的意圖,提供不同的檢索方法,將更符合用戶意圖的搜索結(jié)果排在前列,無(wú)疑會(huì)增加搜索引擎用戶的搜索體驗(yàn)。目前搜索引擎已經(jīng)部分實(shí)現(xiàn)了這種搜索模式,比如用戶搜索“北京天氣”的時(shí)候會(huì)主動(dòng)將當(dāng)天的氣溫等情況列在搜索結(jié)果最前面。
意圖搜索是基于目前internet上信息的無(wú)組織、異構(gòu)、分布和動(dòng)態(tài)的特點(diǎn)以及現(xiàn)有搜索的不足而提出的,用于解決現(xiàn)有信息檢索系統(tǒng)所面臨的“信息過(guò)載”、“資源迷向”和搜索結(jié)果個(gè)性化需求等實(shí)際問(wèn)題,實(shí)現(xiàn)Internet信息個(gè)性化主動(dòng)服務(wù)。搜索引擎在強(qiáng)化“智能化”方向的理念之上,在自動(dòng)分類(lèi)、自動(dòng)聚類(lèi)的基礎(chǔ)上推出智能導(dǎo)航、概念搜索、個(gè)性化搜索功能,使搜索引擎充分領(lǐng)會(huì)用戶意圖的進(jìn)行搜索,這是意圖搜索在搜索引擎方面的落地應(yīng)用模式。
當(dāng)前大多數(shù)搜索引擎是通過(guò)用戶注冊(cè)及用戶個(gè)性化配置(利用cookie機(jī)制、為用戶建立配置文件等)來(lái)提高對(duì)用戶搜索請(qǐng)求的精度和命中率,實(shí)現(xiàn)一定程度上的個(gè)性化搜索服務(wù)。這種方式需要用戶在服務(wù)器上登記個(gè)人信息,但這可能造成用戶某些隱私信息的泄露。目前比較公認(rèn)的搜索引擎意圖搜索方法是采用特征獲取方法。
特征獲取方法分為兩類(lèi),第一類(lèi)方式可以稱(chēng)為事先方法,這種方法在查詢被提交給搜索引擎以前,利用查詢本身的特征來(lái)表示查詢,比如表示特定需求的特征詞匯、詞與詞之間關(guān)系、詞的詞性以及詞的選擇優(yōu)先性、在語(yǔ)料集中的統(tǒng)計(jì)信息等等;第二類(lèi)方法可以稱(chēng)為事后方法,這種方法利用查詢被提交給搜索引擎以后的相關(guān)數(shù)據(jù)來(lái)獲取查詢的特征。
意圖搜索分為意圖分析和分析擴(kuò)展兩個(gè)部分。意圖分析是解決“信息過(guò)載”和“資源迷向”問(wèn)題的有效途徑,通過(guò)對(duì)用戶所需的信息資源進(jìn)行搜集、加工、整理,可以梳理和有序化網(wǎng)絡(luò)上的專(zhuān)業(yè)信息資源,向用戶提供智能化的信息服務(wù)。意圖分析和分析擴(kuò)展的具體步驟如下所述:
(1)意圖分析。
①根據(jù)用戶對(duì)問(wèn)題的回答,檢索知識(shí)庫(kù)中的相關(guān)信息,以提供直接的回答。
②對(duì)輸入的原始查詢根據(jù)其概念內(nèi)容進(jìn)行組織和安排,以析取相關(guān)的概念信息和范疇知識(shí)。然后,通過(guò)語(yǔ)義聯(lián)想等意圖推理修改查詢向量。
③將查詢向量交由用戶交互確認(rèn)、編輯。
④根據(jù)用戶的編輯結(jié)果可以再次意圖推理,直到用戶滿意為止。
⑤將此次意圖推理的結(jié)果記入知識(shí)庫(kù)中,以備以后的意圖推理。
(2)分析擴(kuò)展。
根據(jù)意圖分析的結(jié)果,更新原始查詢向量,形成新的查詢向量。方法是將應(yīng)用領(lǐng)域知識(shí)和索引、相關(guān)性、估計(jì)和查詢表達(dá)相結(jié)合來(lái)實(shí)現(xiàn)查詢擴(kuò)展,即查詢索引還包括不在用戶查詢中出現(xiàn)的查詢?cè)~部分。
查詢擴(kuò)展所需要的查詢?cè)~的選擇策略有:
①非獨(dú)立類(lèi)。非獨(dú)立詞指的是和查詢?cè)~具有較大相關(guān)性的詞。查詢擴(kuò)展通過(guò)知識(shí)庫(kù)推理從知識(shí)庫(kù)中找出相關(guān)性詞、短語(yǔ)、句子、段/篇章。
②交互式選擇。用戶從通過(guò)上述策略得出的待選詞中決定最后的查詢?cè)~。
三、意圖搜索與安防行業(yè)的結(jié)合
2014年發(fā)生的震驚全球的“馬航失聯(lián)”事件牽動(dòng)了無(wú)數(shù)中國(guó)人的心,泛太平洋各國(guó)均提供了大量幫助用于搜索失聯(lián)航班,但是由于搜索方式千奇萬(wàn)種、信息達(dá)到海量級(jí)別、信息來(lái)源不連續(xù)性等多種問(wèn)題,導(dǎo)致搜索遲遲沒(méi)有結(jié)果。仔細(xì)分析搜索方式,可以發(fā)覺(jué)這類(lèi)型的搜索形式其實(shí)與互聯(lián)網(wǎng)行業(yè)的搜索引擎意圖搜索有相似之處,相似點(diǎn)在于都需要對(duì)數(shù)據(jù)進(jìn)行收集、甄別、過(guò)濾、分類(lèi)、整合,都不是一個(gè)單一的行動(dòng),而是一整套連貫的過(guò)程。
物聯(lián)網(wǎng)行業(yè)本身由于傳感器的多種多樣導(dǎo)致數(shù)據(jù)形式多樣性、信息海量性等特征,如果大數(shù)據(jù)環(huán)境下還是采用過(guò)去的全文檢索方式進(jìn)行單一化搜索,未來(lái)一定無(wú)法滿足用戶的智能化需求。針對(duì)這一挑戰(zhàn),2014中國(guó)大數(shù)據(jù)峰會(huì)上中國(guó)工程院吳曼青院士發(fā)表了名為“存在就有痕跡,聯(lián)系就有信息,反恐環(huán)境下大數(shù)據(jù)的意圖搜索”的專(zhuān)題演講,吳院士以眾多美國(guó)案例為引,描述了新時(shí)代反恐行動(dòng)應(yīng)用的特性:法律保障、以人為核心、高技術(shù)手段、國(guó)際合作,通過(guò)構(gòu)建虛擬空間信息社會(huì)雷達(dá)的方式將意圖搜索引用到反恐活動(dòng)中,提升反恐能力。
基于“存在就有痕跡,聯(lián)系就有信息”的基本理念,構(gòu)建網(wǎng)絡(luò)空間中行為事件、思想事件等模型,在實(shí)體空間和虛擬空間中全面收集人的存在痕跡和聯(lián)系信息,關(guān)注人物或事件間聯(lián)系鏈,從而實(shí)現(xiàn)網(wǎng)絡(luò)空間中存在的各種意圖,完成對(duì)意圖產(chǎn)生源頭、傳播途徑和發(fā)展趨勢(shì)的全方位描述,達(dá)到對(duì)個(gè)人和組織的所思所想行為所在的全面搜索和分析。物聯(lián)網(wǎng)行業(yè)擁有海量的視頻、音頻、圖片數(shù)據(jù),通過(guò)相應(yīng)智能算法可以從中提取出可供分類(lèi)的結(jié)構(gòu)化信息,通過(guò)這些結(jié)構(gòu)化信息與意圖搜索技術(shù)相結(jié)合可以幫助用戶快速預(yù)判事物、事件發(fā)生概率和趨勢(shì)。
因國(guó)內(nèi)反恐形勢(shì)嚴(yán)峻,大數(shù)據(jù)搜索需要積極應(yīng)對(duì)新時(shí)期恐怖主義威脅,立足恐怖主義存在和意圖特征,運(yùn)用大數(shù)據(jù)技術(shù)進(jìn)行深入關(guān)聯(lián)分析,實(shí)現(xiàn)對(duì)恐怖分子的準(zhǔn)確識(shí)別和暴恐事件的提前預(yù)警,有力提升反恐維穩(wěn)核心能力。??低曌鳛榘卜佬袠I(yè)的龍頭,物聯(lián)網(wǎng)概念提出之處就已經(jīng)開(kāi)始涉及其中,相信在不遠(yuǎn)的將來(lái),意圖搜索應(yīng)用可能就在海康威視率先落地。
四、結(jié)語(yǔ)
本文首先針對(duì)意圖搜索的來(lái)源、基本概念作了一些解釋?zhuān)S后針對(duì)產(chǎn)生意圖搜索概念的互聯(lián)網(wǎng)行業(yè)具體發(fā)展過(guò)程、應(yīng)用模式及技術(shù)等做了一些討論,最后對(duì)安防行業(yè)與意圖搜索技術(shù)相結(jié)合的具體形式進(jìn)行了探討,通過(guò)馬航失聯(lián)事件的預(yù)測(cè)性分析告訴讀者意圖搜索如何在安防、反恐等領(lǐng)域發(fā)揮自己的作用,如何與物聯(lián)網(wǎng)緊密結(jié)合。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11