
文本分析一般會(huì)從解析文本開(kāi)始,然后將各種單詞、短語(yǔ)以及包含文本的部分賦予語(yǔ)義。我們可以通過(guò)簡(jiǎn)單的詞頻統(tǒng)計(jì),或更復(fù)雜的操作來(lái)進(jìn)行文本分析。自然語(yǔ)言處理中已經(jīng)有很多諸如此類(lèi)的分析了,這里我們就不再贅述。文本挖掘工具是主流分析套件中一個(gè)不可或缺的組成部分。此外,我們還能找到許多獨(dú)立的文本挖掘工具包。其中一些文本分析工具使用基于規(guī)則的方法,用戶需要調(diào)整軟件才能找到自己感興趣的模式。另一些工具則使用機(jī)器學(xué)習(xí)和其他算法自動(dòng)地發(fā)現(xiàn)數(shù)據(jù)模式。每種方法都各有利弊,其相關(guān)論述已經(jīng)超出了本書(shū)的范圍。我們關(guān)心的是如何使用生成的結(jié)果,而不是使用工具產(chǎn)生結(jié)果的過(guò)程。
做完文本解析和分類(lèi)以后,我們就可以分析這些過(guò)程所產(chǎn)生的結(jié)果了。文本挖掘過(guò)程的輸出結(jié)果通常是其他分析流程的輸入。例如,如果能夠分析出客戶使用電子郵件的情感,就能利用一個(gè)變量將客戶的情感標(biāo)記為正面情感或負(fù)面情感。這種標(biāo)記本身是一種結(jié)構(gòu)化的數(shù)據(jù),可以作為分析流程的輸入。使用非結(jié)構(gòu)化的文本創(chuàng)建結(jié)構(gòu)化的數(shù)據(jù),這個(gè)過(guò)程通常稱為信息提取。
另一個(gè)例子是,假定我們能夠在客戶與公司往來(lái)的郵件中識(shí)別出他們對(duì)公司某些產(chǎn)品的評(píng)價(jià),我們就能利用一系列變量來(lái)標(biāo)識(shí)客戶的產(chǎn)品評(píng)價(jià)。這些變量本身也是結(jié)構(gòu)化的度量指標(biāo),可以用來(lái)做分析。上述這些例子解釋了如何捕獲非結(jié)構(gòu)化數(shù)據(jù)片段,并從中提取出相關(guān)的結(jié)構(gòu)化數(shù)據(jù)。
從非結(jié)構(gòu)化文本中提取結(jié)構(gòu)數(shù)據(jù)
文本分析的例子很好地說(shuō)明了該過(guò)程:獲取非結(jié)構(gòu)化數(shù)據(jù),然后處理該數(shù)據(jù),最后創(chuàng)建出可以用于分析和報(bào)表過(guò)程的結(jié)構(gòu)化數(shù)據(jù)。駕馭大數(shù)據(jù)的一個(gè)重要部分是,利用這種創(chuàng)造性的方式將非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)變成可用于分析的數(shù)據(jù)。
解釋文本數(shù)據(jù)實(shí)際上是相當(dāng)困難的。強(qiáng)調(diào)的詞匯和語(yǔ)境不同,同一個(gè)單詞表達(dá)出來(lái)的意思就不同。面對(duì)純文本,我們根本不知道重點(diǎn)在哪里,也不知道整個(gè)語(yǔ)境。這說(shuō)明我們得事先進(jìn)行一些假設(shè),我們會(huì)在第6 章中更詳細(xì)地討論這個(gè)問(wèn)題。
文本分析既是一門(mén)藝術(shù),也是一門(mén)科學(xué),總會(huì)存在一定的不確定性。文本分析往往會(huì)有分類(lèi)錯(cuò)誤和含義模糊的問(wèn)題。沒(méi)錯(cuò),如果我們?cè)谖谋炯现邪l(fā)現(xiàn)了更好的決策支持模式,那就應(yīng)該使用它。文本分析的目標(biāo)是改進(jìn)你的決策,但并不是令你的決策變得完美。文本數(shù)據(jù)可以有效地提升決策效果,它能提供比沒(méi)有它時(shí)更好的結(jié)果,即使數(shù)據(jù)有噪音或含義模糊時(shí),這一點(diǎn)也成立。
使用文本數(shù)據(jù)
一種目前很流行的文本分析應(yīng)用是所謂的情感分析。情感分析是從大量人群中挖掘出總體觀點(diǎn),并提供市場(chǎng)對(duì)某個(gè)公司的評(píng)論、看法和感受等相關(guān)信息。情感分析通常使用社會(huì)化媒體網(wǎng)站的數(shù)據(jù)。以下是情感分析的幾個(gè)例子。
公司或產(chǎn)品的口碑怎么樣?
大家正在討論的是公司的哪些活動(dòng)?
大家對(duì)公司、產(chǎn)品和服務(wù)的評(píng)價(jià)是好是壞?
如前所述,文本分析的難點(diǎn)在于詞匯和語(yǔ)境是相關(guān)的。我們要考慮到這個(gè)問(wèn)題,但大量的評(píng)價(jià)會(huì)讓客戶情感的傾向變得明確。如果我們可以解讀出人們?cè)谏缃幻襟w上所說(shuō)內(nèi)容、與客服互動(dòng)信息的趨勢(shì),這會(huì)對(duì)規(guī)劃下一步的工作有很大的價(jià)值。
如果公司可以掌握每一個(gè)客戶的情感信息,就能了解客戶的意圖和態(tài)度。與使用網(wǎng)絡(luò)數(shù)據(jù)推斷客戶意圖的方法類(lèi)似,了解客戶對(duì)某種產(chǎn)品的總體情感是正面情感還是負(fù)面情感也是很有價(jià)值的信息。如果這名客戶此時(shí)還沒(méi)有購(gòu)買(mǎi)該產(chǎn)品,那價(jià)值就更大了。情感分析提供的信息可以讓我們知道要說(shuō)服這名客戶購(gòu)買(mǎi)該產(chǎn)品的難易程度。
文本數(shù)據(jù)的另一個(gè)用途是模式識(shí)別。我們對(duì)客戶的投訴、維修記錄和其他的評(píng)價(jià)進(jìn)行排序,期望在問(wèn)題變大之前,能夠更快地識(shí)別和修正問(wèn)題。產(chǎn)品首次發(fā)布,然后開(kāi)始出現(xiàn)投訴,文本分析可以識(shí)別出客戶在哪些方面存在問(wèn)題。我們甚至可以做到在客服電話接二連三打進(jìn)來(lái)之前,先把問(wèn)題識(shí)別出來(lái)。這樣我們就能更快地、更積極地做出響應(yīng)。公司可以及時(shí)地做出反應(yīng),解決產(chǎn)品未來(lái)發(fā)行版本中同樣的問(wèn)題,也能主動(dòng)與客戶進(jìn)行接觸,緩解他們當(dāng)下遇到困難時(shí)的焦躁情緒。
欺詐檢測(cè)也是文本數(shù)據(jù)的重要應(yīng)用之一。在健康險(xiǎn)或傷殘保險(xiǎn)的投訴事件中,使用文本分析技術(shù)可以解析出客戶的評(píng)論和理由。文本分析可以將欺詐模式識(shí)別出來(lái),標(biāo)記出風(fēng)險(xiǎn)的高低。面對(duì)高風(fēng)險(xiǎn)的投訴,需要更仔細(xì)地檢查。另一方面,投訴在某種程度上還能自動(dòng)地執(zhí)行。如果系統(tǒng)發(fā)現(xiàn)了投訴模式、詞匯和短語(yǔ)沒(méi)有問(wèn)題,就可以認(rèn)定這些投訴是低風(fēng)險(xiǎn)的,并可以加速處理,同時(shí)將更多的資源投入高風(fēng)險(xiǎn)的投訴中。
法律事務(wù)也會(huì)從文本分析中受益。按照慣例,任何法律案件在上訴前都會(huì)索取相應(yīng)的電子郵件和其他通信歷史記錄。這些通信文本會(huì)被批量地檢查,識(shí)別出與本案相關(guān)的那些語(yǔ)句。例如,哪些電子郵件中有隱藏的內(nèi)幕消息?哪些人在和別人交流時(shí)說(shuō)的是假話?威脅背后的實(shí)質(zhì)是什么?
在法律案件中應(yīng)用文本分析的做法稱為電子偵察。所有預(yù)先進(jìn)行的分析將幫助起訴獲得成功。不使用文本分析,僅通過(guò)人工的方式將無(wú)法瀏覽所有的所需文檔。即使我們可以做到人工瀏覽那些文檔,但因?yàn)槿蝿?wù)本身過(guò)于單調(diào)枯燥,我們很可能會(huì)漏掉其中的一些關(guān)鍵信息。
文本數(shù)據(jù)可能會(huì)對(duì)所有的行業(yè)都產(chǎn)生影響。它可能是如今使用最廣泛的一類(lèi)大數(shù)據(jù)。對(duì)企業(yè)來(lái)講,掌握如何收集、解析和分析文本是很重要的。文本是我們必須駕馭的一種大數(shù)據(jù)源。
多個(gè)行業(yè):時(shí)間數(shù)據(jù)與位置數(shù)據(jù)的價(jià)值
隨著全球定位系統(tǒng)(GPS)、個(gè)人GPS 設(shè)備、手機(jī)的出現(xiàn),時(shí)間和位置的信息一直在增加。從Foursquare 到Google Places ,再到Facebook Places ,它們提供了大量的服務(wù)與應(yīng)用,可以記錄每個(gè)人在某個(gè)時(shí)間點(diǎn)的位置。手機(jī)應(yīng)用程序可以記錄我們的位置和移動(dòng)的軌跡。即使手機(jī)沒(méi)有正式開(kāi)啟GPS ,我們還是可以使用基站信號(hào)來(lái)獲得相當(dāng)準(zhǔn)確的位置信息。
消費(fèi)者應(yīng)用程序中有一些新穎的使用這些信息的方法,這些方法可以捕捉到消費(fèi)者允許其捕獲的信息。例如,有一些應(yīng)用使我們可以追蹤鍛煉中行進(jìn)的路線,路線的長(zhǎng)度,以及走完該路線所需要的時(shí)間。事實(shí)上,如果攜帶了手機(jī),我們就能記錄去過(guò)的每一個(gè)地方。我們還可以選擇把數(shù)據(jù)公開(kāi)給他人。當(dāng)更多的人向公眾公開(kāi)了自己的時(shí)間和位置數(shù)據(jù),就會(huì)出現(xiàn)一些非常有趣的事情。
許多公司已經(jīng)開(kāi)始意識(shí)到掌握客戶的時(shí)間與位置數(shù)據(jù)的威力,它們開(kāi)始嘗試從客戶那里收集這類(lèi)信息。當(dāng)然,這類(lèi)信息必須建立在篩選的基礎(chǔ)上,并且必須制定明確的隱私政策,并嚴(yán)格地遵守這些政策。許多公司推出了令人難以抗拒的位置價(jià)值服務(wù),吸引用戶把時(shí)間和位置信息開(kāi)放給它們。
我們并非只想了解消費(fèi)者的時(shí)間和位置信息??ㄜ?chē)車(chē)隊(duì)的領(lǐng)導(dǎo)也想掌握每輛卡車(chē)在某個(gè)時(shí)間點(diǎn)的位置,比薩店肯定想知道每名外送人員某個(gè)時(shí)間在什么地方,養(yǎng)寵物的人肯定想知道寵物在外面的什么地方,大型宴會(huì)中組織人員需要知道侍者四處走動(dòng)的效率和響應(yīng)顧客的速度。
從收集個(gè)人、資產(chǎn)的時(shí)間和位置數(shù)據(jù)開(kāi)始,企業(yè)可以快速地進(jìn)入大數(shù)據(jù)領(lǐng)域。如果這些信息能夠頻繁地更新就更好了。知道每輛卡車(chē)每天早晚的位置是一回事兒,知道每輛卡車(chē)每秒鐘在哪兒就是另外一回事兒了。時(shí)間和位置數(shù)據(jù)被采用、應(yīng)用的程度將越來(lái)越高,其造成的影響也將越來(lái)越大。
使用時(shí)間和位置數(shù)據(jù)
時(shí)間和位置數(shù)據(jù)是對(duì)隱私最敏感的一類(lèi)大數(shù)據(jù)。我們面對(duì)的不僅有隱私問(wèn)題,還有道德和倫理問(wèn)題。我們是否要在孩子們的胳膊上安裝芯片,以便當(dāng)他們迷路時(shí)可以追蹤到他們?老年癡呆患者離家出走或者擅自離開(kāi)護(hù)理機(jī)構(gòu)時(shí)我們應(yīng)該怎么做?當(dāng)然,時(shí)間和位置數(shù)據(jù)被濫用的可能性會(huì)相當(dāng)高。但從好的方面想,它們被合理使用的可能性同樣也會(huì)很高。下面我們來(lái)看一些例子。
可能很快人們就會(huì)在警察局和消防部門(mén)注冊(cè),并提供自己日常會(huì)去哪些地方的信息。這樣,如果遇到洪水、火災(zāi)或封路這類(lèi)大事件,人們會(huì)收到警察局和消防部門(mén)發(fā)送的警告信息,告訴他們即將路過(guò)的地方有情況,提醒他們繞道。如果人們可以主動(dòng)避開(kāi)是非之地,就能使交通中斷的時(shí)間降到最低,這樣每個(gè)人的時(shí)間都能節(jié)省下來(lái)。最后,在得到你的許可后,當(dāng)?shù)卣踔量梢越邮漳愕膶?shí)時(shí)位置信息。
一種初露端倪的數(shù)據(jù)使用方法是開(kāi)發(fā)對(duì)時(shí)間和位置信息敏感的消息通知,這個(gè)市場(chǎng)的未來(lái)空間很大。通知不再局限于當(dāng)天或本周,而是根據(jù)客戶的時(shí)間和位置信息提供最適合的消息通知。現(xiàn)在的做法一般是由客戶簽到并告知他們的位置,這樣他們就能接收到通知信息了。公司能夠持續(xù)地跟蹤到客戶的動(dòng)向,以做出相應(yīng)的反應(yīng)。
例如,可能用戶會(huì)告訴你,他要在5:30 分離開(kāi)辦公室回家,大約5:45 到6:00 之間會(huì)開(kāi)車(chē)通過(guò)5 號(hào)出口。他要找地方吃飯,并且想了解你的商店或餐館那個(gè)時(shí)間有什么食物。你需要在那個(gè)時(shí)間那個(gè)地點(diǎn)提供匹配他的需求的可口飯菜。第二天早上才通過(guò)電子郵件告訴他相關(guān)的信息顯然已經(jīng)太遲了,我們要的是當(dāng)他通過(guò)那個(gè)地方的那一刻就主動(dòng)推送給他通知信息。
按照地點(diǎn)和時(shí)間主動(dòng)推送通知信息
營(yíng)銷(xiāo)領(lǐng)域漸漸顯露出來(lái)的一個(gè)趨勢(shì)是,只對(duì)剛好處在某個(gè)時(shí)間段和某個(gè)地點(diǎn)的客戶才針對(duì)性地推送通知信息。與根據(jù)大范圍的時(shí)間和地點(diǎn)發(fā)送的通知相比,這種通知的效果更好,針對(duì)性更強(qiáng)。早期采用這種作法的企業(yè)已經(jīng)取得了令人吃驚的效果。
當(dāng)然管理這種通知的復(fù)雜性要高不少,因?yàn)槲覀円龅牟恢皇歉櫭總€(gè)人當(dāng)周的服務(wù)推薦這么簡(jiǎn)單。我們需要關(guān)心的是每個(gè)用戶每時(shí)每刻在什么地方,我們?cè)谶@個(gè)時(shí)間點(diǎn)為他們推薦什么東西最合適。根據(jù)時(shí)間和位置推送通知確實(shí)大大地增加了復(fù)雜性,并且變得難以管理。但我們相信假以時(shí)日,如果我們做得不錯(cuò),這種方式的轉(zhuǎn)化率應(yīng)該會(huì)遠(yuǎn)遠(yuǎn)超過(guò)傳統(tǒng)的個(gè)性化推薦。歷史經(jīng)驗(yàn)反復(fù)地告訴我們,如果通知信息越精準(zhǔn),轉(zhuǎn)化率就會(huì)越高。
使用此類(lèi)數(shù)據(jù)的另一種模式是增強(qiáng)型社交網(wǎng)絡(luò)分析。無(wú)線運(yùn)營(yíng)公司可以根據(jù)語(yǔ)音和文本交流信息識(shí)別出用戶間的關(guān)系,借助時(shí)間和位置數(shù)據(jù)可以識(shí)別出哪些人在同一時(shí)間出現(xiàn)在了同一個(gè)地方。例如,哪些人在聽(tīng)音樂(lè)會(huì)或看電影?哪些人要去觀看某一場(chǎng)體育比賽?哪些人在同一時(shí)間同一餐館就餐?
如果能識(shí)別出哪些人大約在同一時(shí)間同一地點(diǎn)出現(xiàn),就能識(shí)別出有哪些彼此不認(rèn)識(shí)或者在同一個(gè)社交圈子里的人,但是他們都有著很多共同的愛(ài)好。想象一下,如果婚介服務(wù)能用這樣的信息幫助我們找到自己的另一半那該有多好!我們可以鼓勵(lì)人們建立聯(lián)系,給他們提供符合個(gè)人身份或團(tuán)體身份的產(chǎn)品推薦。
時(shí)間和位置數(shù)據(jù)不僅可以幫助我們理解客戶的歷史模式,還可以準(zhǔn)確地預(yù)測(cè)客戶未來(lái)會(huì)出現(xiàn)在什么地方。對(duì)于有固定習(xí)慣的客戶尤其如此。如果我們知道某個(gè)人會(huì)在哪里出現(xiàn),要往哪里去,我們就能預(yù)測(cè)出他們10 分鐘或一個(gè)小時(shí)以后會(huì)出現(xiàn)在哪里。如果我們知道客戶以前在同一條路上去過(guò)哪里,我們就能更準(zhǔn)確地做出他現(xiàn)在要去往何處的預(yù)測(cè)。我們最差也能大大地減少列表上的候選路線,這樣就能支持更精準(zhǔn)的營(yíng)銷(xiāo)。
未來(lái)幾年間,時(shí)間和位置數(shù)據(jù)的應(yīng)用會(huì)經(jīng)歷爆炸性的增長(zhǎng),面向消費(fèi)者的選擇流程和激勵(lì)措施終將成熟?,F(xiàn)在我們要小心行事,并在我們使用這些信息之前,獲得用戶的許可。使用時(shí)間和位置數(shù)據(jù)的消息通知將會(huì)更有針對(duì)性、更個(gè)性化。在不遠(yuǎn)的將來(lái),如果通知信息不是根據(jù)時(shí)間和位置推送的,也許會(huì)被認(rèn)為很土。
零售制造業(yè):RFID數(shù)據(jù)的價(jià)值
無(wú)線射頻標(biāo)簽,即RFID 標(biāo)簽,是安裝在裝運(yùn)托盤(pán)或產(chǎn)品外包裝上的一種微型標(biāo)簽。RFID 標(biāo)簽上有一個(gè)唯一的序列號(hào),這個(gè)序列號(hào)與UPC 類(lèi)似的通用產(chǎn)品標(biāo)識(shí)碼不同。換言之,RFID 標(biāo)簽不僅能夠識(shí)別出托盤(pán)上裝的是Model 123 電腦,還能識(shí)別出托盤(pán)上裝運(yùn)的是獨(dú)一無(wú)二的、特定的一套Model 123 電腦。
RFID 讀卡器發(fā)出信號(hào),RFID 標(biāo)簽返回響應(yīng)信息。如果多個(gè)標(biāo)簽都在讀卡器讀取范圍內(nèi),它們同樣會(huì)對(duì)同一查詢做出響應(yīng),這樣辨識(shí)大量物品就會(huì)變得比較容易。即使當(dāng)這些東西堆疊在一起或者放到了墻后面,只要信號(hào)可以穿透,我們就能得到響應(yīng)信息。有了RFID 標(biāo)簽,我們就不再需要人工記錄和盤(pán)點(diǎn)每個(gè)商品,這樣清點(diǎn)商品的時(shí)間就會(huì)縮短。
多數(shù)用于高價(jià)值應(yīng)用外的RFID 標(biāo)簽都是被動(dòng)式的無(wú)源標(biāo)簽,意味著這些標(biāo)簽是沒(méi)有內(nèi)置電池的。讀卡器的無(wú)線電波產(chǎn)生磁場(chǎng),該磁場(chǎng)給標(biāo)簽提供了足夠的能量,使得標(biāo)簽可以將內(nèi)置信息發(fā)送出去。RFID 技術(shù)已經(jīng)出現(xiàn)很長(zhǎng)時(shí)間了,但成本問(wèn)題限制了該應(yīng)用的進(jìn)一步推廣。今天,無(wú)源標(biāo)簽的成本只有幾美分,而且價(jià)格還在不斷下跌。隨著階格的不斷下跌,實(shí)際應(yīng)用情況將會(huì)出現(xiàn)持續(xù)增長(zhǎng)。現(xiàn)在的RFID 技術(shù)還有一些問(wèn)題,例如,液體會(huì)屏蔽標(biāo)簽的信號(hào)。隨著時(shí)間的推移,這些技術(shù)問(wèn)題都將會(huì)得到有效的解決。
有些RFID 應(yīng)用很多人都曾經(jīng)接觸過(guò),其中之一就是自動(dòng)收費(fèi)標(biāo)簽。有了它,司機(jī)通過(guò)高速公路收費(fèi)站的時(shí)候就不需要再停車(chē)了。它的工作原理是,交通管理局在所發(fā)的卡中植入了RFID 標(biāo)簽,同時(shí)高速公路上安裝了讀卡器;當(dāng)汽車(chē)開(kāi)過(guò)時(shí),標(biāo)簽會(huì)把汽車(chē)數(shù)據(jù)傳到讀卡器,這樣我們開(kāi)車(chē)通過(guò)收費(fèi)站就被記錄下來(lái)了。
RFID 數(shù)據(jù)的另一個(gè)重要應(yīng)用是資產(chǎn)跟蹤。例如,一家公司想把其擁有的每一個(gè)PC、桌椅、電視等資產(chǎn)都貼上標(biāo)簽。這些標(biāo)簽可以很好地幫助我們進(jìn)行庫(kù)存跟蹤。跟蹤這些物品。如果物品移出指定區(qū)域,它們就會(huì)發(fā)送警告信息。例如,我們可以把讀卡器放在出口處,如果公司資產(chǎn)在沒(méi)有被事先批準(zhǔn)的情況下出門(mén),警報(bào)很快就會(huì)響起來(lái),這樣就能起到安全警示的作用了。這種作法類(lèi)似于零售商店里的物品標(biāo)簽,如果標(biāo)簽變?yōu)闊o(wú)效,警報(bào)就會(huì)被拉響。
RFID 最大的應(yīng)用之一是制造業(yè)的托盤(pán)跟蹤和零售業(yè)的物品跟蹤。例如,制造商發(fā)往零售商的每一個(gè)托盤(pán)上都有標(biāo)簽,這樣可以很方便地記錄哪些貨物在某個(gè)配送中心或者商店。最終,商店中價(jià)格很低的商品也可以配備RFID 芯片,或者使用一種類(lèi)似的新技術(shù)?,F(xiàn)在我們已經(jīng)明白了RFID 數(shù)據(jù)是什么,下面我們來(lái)看一看RFID 數(shù)據(jù)可以從哪些方面來(lái)改善當(dāng)前的商業(yè)模式。
使用無(wú)線射頻標(biāo)簽數(shù)據(jù)
RFID 的一種增值應(yīng)用是識(shí)別零售商貨架上有沒(méi)有相應(yīng)的商品。如果讀卡器能夠連續(xù)不斷地確定貨架上每種商品的存量,當(dāng)需要重新配貨的時(shí)候,我們就能得到準(zhǔn)確的信息。使用RFID 可以更好地跟蹤貨架的供應(yīng)狀況,因?yàn)樯唐访撲N(xiāo)和有商品可供應(yīng)的狀態(tài)是完全不同的。一種可能的情況是,商店貨架上沒(méi)有該商品了,但后面儲(chǔ)藏室里還有5 件該商品。
在這種情況下,任何傳統(tǒng)的商品脫銷(xiāo)分析都會(huì)顯示貨架上現(xiàn)在仍有存貨,因此不需要擔(dān)心。當(dāng)銷(xiāo)售業(yè)績(jī)開(kāi)始下滑時(shí),人們才會(huì)發(fā)現(xiàn)問(wèn)題所在。如果有RFID 標(biāo)簽,就可以跟蹤到儲(chǔ)藏室中還有5 件該商品,但貨架上卻沒(méi)有該商品了。這樣,我們只需要簡(jiǎn)單地從儲(chǔ)藏室把商品搬到貨架上就能解決問(wèn)題。這個(gè)例子在成本和技術(shù)上有一些挑戰(zhàn),但現(xiàn)在大家正在努力克服這些困難。
RFID 還能很好地幫助我們跟蹤促銷(xiāo)展示影響的效果。通常在促銷(xiāo)過(guò)程中,商品要擺在商店的許多地點(diǎn)進(jìn)行展示。從傳統(tǒng)的POS 數(shù)據(jù)中,我們可以知道促銷(xiāo)商品的銷(xiāo)量,但我們不知道銷(xiāo)售來(lái)自于哪個(gè)展示點(diǎn)。通過(guò)RFID 標(biāo)簽我們可以識(shí)別出商品是從哪個(gè)展示點(diǎn)銷(xiāo)售出去的,這樣我們就能評(píng)估不同的地點(diǎn)對(duì)銷(xiāo)售效果的影響。
RFID 如果和其他數(shù)據(jù)結(jié)合起來(lái),就能發(fā)揮更大的威力。如果公司可以收集配送中心里的溫度數(shù)據(jù),當(dāng)出現(xiàn)掉電或者其他極端事件時(shí),我們就能跟蹤到商品的損壞程度。也許倉(cāng)庫(kù)某一區(qū)域在停電期間的溫度高達(dá)90 攝氏度,且時(shí)間長(zhǎng)達(dá)90 分鐘。有了RFID,我們就能準(zhǔn)確地知道在那個(gè)時(shí)刻哪些托盤(pán)位于配送中心的那個(gè)區(qū)域內(nèi),然后我們就能采取相應(yīng)的行動(dòng)。倉(cāng)庫(kù)數(shù)據(jù)還可以和裝運(yùn)數(shù)據(jù)匹配起來(lái),如果商品發(fā)生了損壞,公司可以有針對(duì)性地召回商品,并通知零售商當(dāng)商品抵達(dá)時(shí)再次對(duì)商品進(jìn)行開(kāi)箱檢查。
組合顯神通
就像許多其他大數(shù)據(jù)源一樣,RFID 數(shù)據(jù)本身并不能發(fā)揮所有的威力。當(dāng)與其他數(shù)據(jù)組合起來(lái)使用時(shí),它們就能發(fā)揮作用。大數(shù)據(jù)戰(zhàn)略的目標(biāo)是把大數(shù)據(jù)和其他數(shù)據(jù)整合到同一個(gè)處理流程中,這一點(diǎn)再怎么強(qiáng)調(diào)也不為過(guò)。使用大數(shù)據(jù)并不是一個(gè)孤立的工作。
RFID 還有一些操作型應(yīng)用。有些配送中心商品管理不嚴(yán)格,導(dǎo)致商品損壞程度很高。對(duì)于某些團(tuán)隊(duì),甚至某些工人來(lái)說(shuō)確實(shí)如此。人力資源(HR)系統(tǒng)會(huì)報(bào)告誰(shuí)在任意時(shí)間點(diǎn)上工作。當(dāng)RFID 數(shù)據(jù)和這類(lèi)數(shù)據(jù)組合起來(lái),就能顯示出商品何時(shí)被移動(dòng)了,還能識(shí)別出損壞、損耗、偷竊商品概率更高的員工。數(shù)據(jù)的組合使用,使我們能夠采取更強(qiáng)大、質(zhì)量更高的行動(dòng)。
RFID 有一種非常有趣的未來(lái)應(yīng)用是跟蹤商店購(gòu)物活動(dòng),就像跟蹤Web 購(gòu)物行為一樣。如果RFID 讀卡器植入購(gòu)物車(chē)中,我們就能準(zhǔn)確地知道哪些客戶把什么東西放進(jìn)了購(gòu)物車(chē),也能準(zhǔn)確地知道他們的放入順序。即使并非每種物品都配有標(biāo)簽,我們?nèi)匀豢梢宰R(shí)別出購(gòu)物車(chē)經(jīng)過(guò)的道路。通過(guò)在店面中使用RFID,Web 數(shù)據(jù)所能帶來(lái)的諸多好處都將變成現(xiàn)實(shí)。最后兩個(gè)例子必須考慮隱私問(wèn)題,因?yàn)橐苍S顧客根本不想讓他們的購(gòu)物行為被跟蹤。我們可以采用“匿名”購(gòu)物的方法,不對(duì)產(chǎn)生數(shù)據(jù)的人進(jìn)行方位識(shí)別。
RFID 的最后一種應(yīng)用是識(shí)別欺詐犯罪活動(dòng),歸還偷盜物品。如果物品貼有RFID 標(biāo)簽,零售商可以通過(guò)標(biāo)簽的ID 進(jìn)行識(shí)別,確定返還物品是否屬于偷走的同一批產(chǎn)品,并采取適當(dāng)?shù)男袆?dòng)。事實(shí)上,關(guān)鍵在于RFID 的ID 可以作為收據(jù)的一部分,輔助返還流程。零售商知道購(gòu)買(mǎi)商品上貼的是哪個(gè)RFID 標(biāo)簽,而不是像平常那樣只知道你購(gòu)買(mǎi)了某種商品。當(dāng)我們來(lái)到退貨臺(tái),要把貼有那個(gè)標(biāo)簽的商品退還。我們肯定不能從貨架上拿下來(lái)另外一個(gè)一模一樣的商品,假裝跟收據(jù)一起返還。以這種方式來(lái)使用RFID,欺詐將會(huì)變得無(wú)比困難。
未來(lái)幾年RFID 有可能會(huì)對(duì)制造業(yè)和零售業(yè)產(chǎn)生巨大的影響。與許多人的期望不同,RFID 的接受速度要慢一些。但RFID 標(biāo)簽價(jià)格在持續(xù)下跌,標(biāo)簽和讀卡器的質(zhì)量卻在不斷上升,從經(jīng)濟(jì)的角度考慮,RFID 的應(yīng)用將會(huì)更加廣泛。
電力行業(yè):智能電網(wǎng)數(shù)據(jù)的價(jià)值
智能電網(wǎng)是下一代電力基礎(chǔ)設(shè)施。與我們周?chē)?jīng)常見(jiàn)到的高壓電傳輸相比,智能電網(wǎng)更先進(jìn)更可靠。智能電網(wǎng)有非常復(fù)雜的監(jiān)控、通信和發(fā)電系統(tǒng),可以提供穩(wěn)定如一的服務(wù),如果出現(xiàn)停電和其他問(wèn)題,可以更好更快地恢復(fù)。各類(lèi)傳感器和監(jiān)控設(shè)備記錄了電網(wǎng)本身和流經(jīng)電流的許多信息。
智能電網(wǎng)中的一個(gè)環(huán)節(jié)是我們經(jīng)常提到的智能電表。智能電表是一種傳統(tǒng)電表的替代品。從外觀上看,智能電表和我們一直使用的電表沒(méi)有什么不同,但智能電表的功能更強(qiáng)大。以前抄表人員都是每隔幾周或幾個(gè)月就挨家挨戶地抄電表,而智能電表可以每隔15 分鐘到一個(gè)小時(shí)從每一個(gè)家庭或企業(yè)自動(dòng)地收集數(shù)據(jù),甚至可以跨區(qū)或者跨電網(wǎng)收集數(shù)據(jù)。
雖然我們這里關(guān)注的是智能電表,但在智能電網(wǎng)中大量使用的傳感器也值得一提。這些遍布智能電網(wǎng)但我們卻看不到的傳感器,它們收集到的數(shù)據(jù)從規(guī)模上使智能電表數(shù)據(jù)相形見(jiàn)絀。傳感器每秒鐘要從發(fā)電系統(tǒng)讀取60 次同步相量測(cè)量值,與記錄家用電器開(kāi)關(guān)狀態(tài)的家庭網(wǎng)絡(luò)一樣,它們都是大數(shù)據(jù)的例子。普通人并不知道這些傳感器的存在,但它們對(duì)電網(wǎng)來(lái)說(shuō)十分重要。傳感器要讀取所有的電流數(shù)據(jù)和智能電網(wǎng)的設(shè)備狀態(tài),數(shù)據(jù)量非常非常大。
智能電網(wǎng)技術(shù)已經(jīng)在歐洲和美洲的某些地方開(kāi)始使用了。我們相信在不久的將來(lái),世界上每一處電網(wǎng)都會(huì)被智能電網(wǎng)取代。電力公司因?yàn)槭褂昧酥悄茈娋W(wǎng),它們所掌握的耗電數(shù)據(jù)量會(huì)以指數(shù)級(jí)增長(zhǎng)。這類(lèi)數(shù)據(jù)要怎樣使用?下面我們來(lái)看一下。
使用智能電網(wǎng)數(shù)據(jù)
從用電管理的角度來(lái)看,智能電表數(shù)據(jù)可以幫助人們更好地理解電網(wǎng)中客戶的需求層次。此外,這些數(shù)據(jù)也可以使消費(fèi)者受益。例如業(yè)主可以選擇把待測(cè)試的電器打開(kāi),與此同時(shí)保持其他電器的穩(wěn)定,這時(shí)從智能電表處可以監(jiān)控到詳細(xì)的電力消耗情況,這樣我們就可以明確地測(cè)量出各種電器究竟消耗了多少電量。
世界各國(guó)的電力公司現(xiàn)在都已經(jīng)在積極地轉(zhuǎn)向這樣的定價(jià)模型,即按時(shí)間或需求量的變化來(lái)定價(jià),智能電網(wǎng)的出現(xiàn)加速了這種趨勢(shì)。電力公司的主要目標(biāo)之一是利用新的定價(jià)程序來(lái)影響客戶行為,減少高峰時(shí)段的用電量。為了應(yīng)對(duì)用電高峰需要另建發(fā)電站,需要一大筆錢(qián)而且還會(huì)對(duì)環(huán)境造成很大的影響。如果用電成本可以靈活地根據(jù)時(shí)間來(lái)設(shè)定,并由智能電表來(lái)測(cè)量,我們就可以促使客戶改變他們的用電行為。較低的峰值和較為平穩(wěn)的用電需求等同于更少的對(duì)新基礎(chǔ)設(shè)施的需求和更低的成本。
當(dāng)然電力公司通過(guò)智能電表提供的數(shù)據(jù)還能識(shí)別出其他的各類(lèi)趨勢(shì)。哪些地方的用電量有所回落?哪些消費(fèi)者每天或每周的用電需求比較相同?電力公司可以根據(jù)使用模式對(duì)客戶進(jìn)行分類(lèi),可以選擇針對(duì)某些特定的群體開(kāi)發(fā)產(chǎn)品和活動(dòng)。使用這些數(shù)據(jù)我們還可以識(shí)別模式出現(xiàn)異常的那些地方,它們揭示了需要解決的問(wèn)題。
實(shí)際上,電力公司有能力執(zhí)行其他行業(yè)已經(jīng)使用多年的客戶分析工作。例如,電話公司知道我們?cè)碌椎乃匈~單,但并不知道我們具體的通話。零售商店只知道整體銷(xiāo)售狀況,而不知道任何購(gòu)買(mǎi)的細(xì)節(jié)信息。一家金融機(jī)構(gòu)知道我們的月終余額,但并不了解我們這個(gè)月的資金流動(dòng)狀況。從很多方面講,電力公司面對(duì)的這類(lèi)數(shù)據(jù)對(duì)于理解客戶而言仍略顯不足。它們也有簡(jiǎn)單的月終匯總數(shù)據(jù),但這種月結(jié)數(shù)據(jù)往往是估計(jì)值而不是實(shí)際的耗電量。
大數(shù)據(jù)可以改變一個(gè)行業(yè)
有時(shí)候,大數(shù)據(jù)真的可以改變一個(gè)行業(yè),可以把分析應(yīng)用提升到一個(gè)全新的高度。電力行業(yè)使用的智能電網(wǎng)數(shù)據(jù)就是一個(gè)這樣的例子。不再受每月一次抄表的限制,耗電信息會(huì)以秒鐘或分鐘為間隔被測(cè)量。遍布電網(wǎng)的精巧傳感器,使數(shù)據(jù)的使用變得與以往完全不同。以此開(kāi)展的數(shù)據(jù)分析會(huì)在費(fèi)率套餐、用電管理等諸多方面產(chǎn)生很多創(chuàng)新。
有了智能電表數(shù)據(jù),我們就可以進(jìn)行全新的分析,使大眾全都受益。消費(fèi)者可以根據(jù)自己的使用模式定制費(fèi)率套餐,就像車(chē)載信息服務(wù)支持個(gè)性化的汽車(chē)保險(xiǎn)費(fèi)率那樣。高峰時(shí)段用電客戶比非高峰時(shí)段用電客戶的收費(fèi)要高。面對(duì)這樣的刺激政策,我們會(huì)改變自己的用電模式,可能我們會(huì)在下午晚些時(shí)候再使用洗碗機(jī)而不是吃完午飯就馬上使用。
電力公司也會(huì)有更準(zhǔn)確的需求預(yù)測(cè),它們能更清晰地識(shí)別出需求來(lái)自于哪些地方。它們還能了解某一類(lèi)客戶在某個(gè)時(shí)間的用電需求。電力公司可以使用不同的方法來(lái)驅(qū)動(dòng)各種行為,使需求更加平穩(wěn),并降低異常需求峰值出現(xiàn)的頻率。所有這些都會(huì)使對(duì)昂貴的新發(fā)電設(shè)備的需求受到抑制。
每一個(gè)家庭、每一個(gè)行業(yè)都能感受到智能電表數(shù)據(jù)產(chǎn)生的威力,這些數(shù)據(jù)能夠讓我們更好地跟蹤、更積極地管理用電情況。我們不僅能節(jié)約用電,也能使這個(gè)世界更加低碳,還可以幫助大家省錢(qián)。如果我們能清楚地知道自己的耗電量比預(yù)期要多,我們肯定就會(huì)根據(jù)需要做出適當(dāng)?shù)恼{(diào)整。如果只使用每月賬單,我們將無(wú)法識(shí)別出這種機(jī)會(huì)。但是,智能電表數(shù)據(jù)將使這一切變得簡(jiǎn)單。
博彩業(yè):籌碼跟蹤數(shù)據(jù)的價(jià)值
前面我們已經(jīng)討論了RFID 技術(shù)是如何應(yīng)用在零售業(yè)和制造業(yè)的。RFID 技術(shù)的用途實(shí)際上更廣泛,許多應(yīng)用都會(huì)產(chǎn)生大數(shù)據(jù)。RFID 標(biāo)簽的另外一種應(yīng)用是貼在賭場(chǎng)用的籌碼上面。每一個(gè)籌碼,特別是高價(jià)值的籌碼都有自己的內(nèi)置標(biāo)簽,這樣賭場(chǎng)就可以通過(guò)標(biāo)簽的串行編號(hào)實(shí)現(xiàn)唯一的識(shí)別。
賭場(chǎng)里用的老虎機(jī)已經(jīng)被跟蹤了許多年。一旦我們?cè)诶匣C(jī)上刷了經(jīng)常使用的玩家卡或者信用卡,那我們每次搬動(dòng)手柄按下按鍵的動(dòng)作就會(huì)被跟蹤。當(dāng)然你的賭注和你贏的錢(qián)也會(huì)被跟蹤。雖然老虎機(jī)模式的分析歷史悠久,但賭場(chǎng)仍然沒(méi)有從桌面游戲中捕捉到足夠多的細(xì)節(jié)。現(xiàn)在這個(gè)過(guò)程正在發(fā)生變化,標(biāo)簽已經(jīng)開(kāi)始被植入游戲籌碼。
以前賭場(chǎng)會(huì)用功能強(qiáng)大的安全攝像頭網(wǎng)絡(luò)跟蹤籌碼,地勤人員的工作是保證籌碼上下左右的移動(dòng)是合理的。賭臺(tái)經(jīng)理要尋找???,估算他們的平均投注和玩的時(shí)間,并給這種??酮?jiǎng)勵(lì)。雖然賭臺(tái)經(jīng)理精于此道,同時(shí)還能獲得其他人員的幫助,但游戲獎(jiǎng)勵(lì)多多少少總會(huì)不夠準(zhǔn)確。如果被監(jiān)視的玩家碰巧比平常投注多那么一點(diǎn)或少那么一點(diǎn),就會(huì)發(fā)生這種不準(zhǔn)確的情況。有些玩家如果認(rèn)為他們自己正在被監(jiān)視,他們會(huì)利用系統(tǒng)規(guī)則增加投注來(lái)牟利。
同類(lèi)技術(shù)可以驅(qū)動(dòng)多種大數(shù)據(jù)流
零售商和制造商都使用了RFID 技術(shù)。博彩行業(yè)也是如此。它們使用RFID 的方法有許多不同之處,但也有許多相似之處。最有趣的是,一種技術(shù)可以在不同的行業(yè)使用,形成各個(gè)行業(yè)獨(dú)特的大數(shù)據(jù)源。
籌碼跟蹤是一種特殊的RFID 應(yīng)用,除了這個(gè)例子外,RFID 還有很多其他的應(yīng)用。這個(gè)例子說(shuō)明了一些底層相同的技術(shù)可以支持不同的大數(shù)據(jù)流,這些大數(shù)據(jù)流本質(zhì)相同,但范圍和應(yīng)用卻完全不同。讓我們興奮的是,這種基礎(chǔ)技術(shù)有著完全不同的用處,產(chǎn)生了多種行業(yè)里形式各異的大數(shù)據(jù)。
使用籌碼跟蹤數(shù)據(jù)
使用籌碼標(biāo)簽的一個(gè)明顯優(yōu)點(diǎn)是可以準(zhǔn)確地跟蹤每位玩家下的賭注。標(biāo)簽可以保證玩家在經(jīng)常性的玩家活動(dòng)中賺到所有的積分,不會(huì)多也不會(huì)少。這就給玩家和賭場(chǎng)同時(shí)帶來(lái)了好處。對(duì)于賭場(chǎng)而言,資源可以更準(zhǔn)確地配置給正確的玩家,過(guò)度獎(jiǎng)勵(lì)錯(cuò)誤的玩家和過(guò)少獎(jiǎng)勵(lì)正確的玩家都會(huì)導(dǎo)致有限營(yíng)銷(xiāo)資源的非最優(yōu)分配,而玩家當(dāng)然希望他們的積分永遠(yuǎn)準(zhǔn)確無(wú)誤。
有了玩家的賭注數(shù)據(jù),賭場(chǎng)就可以更好地對(duì)玩家進(jìn)行分類(lèi),以理解投注模式。誰(shuí)會(huì)每次先下注5 美元,但幾乎每隔一段時(shí)間就把投注升到100 美元呢?誰(shuí)會(huì)每次下注10 美元?可以根據(jù)這些模式對(duì)玩家進(jìn)行分類(lèi)。投注模式還能揭示21 點(diǎn)博彩游戲中誰(shuí)在算牌,因?yàn)槿绻婕沂褂盟闩萍记傻脑?,某種賭注模式就會(huì)凸顯出來(lái)。
賭場(chǎng)使用籌碼跟蹤技術(shù),玩家想要主動(dòng)欺騙賭場(chǎng)將會(huì)變得更困難,甚至連莊家想犯錯(cuò)都比較困難。因?yàn)榛I碼的投注和分紅都可以被跟蹤到,我們可以很容易地回過(guò)頭來(lái)對(duì)比視頻,檢查21 點(diǎn)某一次出牌或者分紅的結(jié)果。即使胳膊和頭擋住了我們的視線,看不清楚拿起來(lái)或者放下去的籌碼,但RFID 數(shù)據(jù)依然可以提供細(xì)節(jié)信息。賭場(chǎng)可以識(shí)別發(fā)生的錯(cuò)誤或者欺詐。譬如說(shuō)當(dāng)莊家往另一個(gè)方向看的時(shí)候,玩家放下了一筆籌碼。
時(shí)段分析可以識(shí)別出莊家或玩家犯下異常錯(cuò)誤的數(shù)目。它可以幫助我們處理欺詐活動(dòng),或者對(duì)犯下大量簡(jiǎn)單錯(cuò)誤的莊家進(jìn)行額外培訓(xùn)?;I碼計(jì)算錯(cuò)誤也會(huì)因之而下降,統(tǒng)計(jì)大量各種面額的籌碼是非常單調(diào)的工作,人們往往會(huì)在這個(gè)過(guò)程中犯錯(cuò),RFID 支持更快更準(zhǔn)確的計(jì)算。
將前面這個(gè)例子講得更深入一點(diǎn)兒,對(duì)小偷來(lái)說(shuō),跟蹤每個(gè)籌碼的舉措具有相當(dāng)強(qiáng)的威懾作用。如果一摞籌碼被偷走了,那些籌碼的標(biāo)識(shí)就會(huì)被標(biāo)記成“已被偷”。如果有人進(jìn)來(lái)兌換這些籌碼,甚至拿著這些籌碼坐到桌子旁邊,系統(tǒng)就會(huì)注意到,并拉響安全警報(bào)。如果小偷偷走或者更換了這些籌碼,那標(biāo)簽就不能被讀取。賭場(chǎng)清楚籌碼的ID,它們希望所有的籌碼都報(bào)告一個(gè)合法的ID。如果某個(gè)籌碼沒(méi)有報(bào)告ID,或者報(bào)告的ID 不合法,那它們就會(huì)采取措施。
就像其他行業(yè)一樣,賭場(chǎng)對(duì)欺詐行為阻止得越多,分紅就會(huì)越合理,風(fēng)險(xiǎn)也就會(huì)越低。因?yàn)橘M(fèi)用支出比較少,這樣我們就有能力給玩家提供更好的服務(wù)和投注賠率。對(duì)于賭場(chǎng)和玩家而言,這是雙贏。
工業(yè)發(fā)動(dòng)機(jī)和設(shè)備:傳感器數(shù)據(jù)的價(jià)值
世界各地安裝了許多復(fù)雜的機(jī)器和發(fā)動(dòng)機(jī),例如,飛機(jī)、火車(chē)、軍車(chē)、建筑設(shè)備、鉆孔設(shè)備等。因?yàn)樵靸r(jià)昂貴,保持這些設(shè)備的穩(wěn)定運(yùn)轉(zhuǎn)是非常重要的。近些年來(lái),從飛機(jī)發(fā)動(dòng)機(jī)到坦克等各種機(jī)器上也開(kāi)始使用嵌入式傳感器,目標(biāo)是以秒或毫秒為單位來(lái)監(jiān)控設(shè)備的狀態(tài)。
監(jiān)測(cè)工作可以做得相當(dāng)細(xì),特別是在測(cè)試和開(kāi)發(fā)過(guò)程中。例如,當(dāng)新的發(fā)動(dòng)機(jī)開(kāi)發(fā)出來(lái),就得依靠獲取到的足夠多的細(xì)節(jié)信息,來(lái)檢查發(fā)動(dòng)機(jī)是否可以按照預(yù)期設(shè)定的方式工作。一旦新發(fā)動(dòng)機(jī)進(jìn)入市場(chǎng),再想更換有缺陷的部件的花費(fèi)會(huì)相當(dāng)高,因此我們需要事先詳細(xì)地進(jìn)行性能分析。監(jiān)測(cè)是一項(xiàng)不斷持續(xù)的活動(dòng)。也許我們并不需要持續(xù)收集每一毫秒的細(xì)節(jié)信息,但如果能夠收集到大量的細(xì)節(jié)信息,我們就可以評(píng)估該設(shè)備的生命周期,識(shí)別出重復(fù)出現(xiàn)的問(wèn)題。
例如,發(fā)動(dòng)機(jī)傳感器可以收集到從溫度到每分鐘轉(zhuǎn)數(shù)、燃料攝入率再到油壓級(jí)別等信息,而數(shù)據(jù)可以根據(jù)預(yù)先設(shè)定的頻率獲取。當(dāng)讀數(shù)頻率、讀取指標(biāo)數(shù)量和監(jiān)控項(xiàng)目數(shù)量增加時(shí),數(shù)據(jù)量會(huì)迅速增加。為什么我們要關(guān)心這一點(diǎn)?下面我們來(lái)看一些例子。
使用傳感器數(shù)據(jù)
發(fā)動(dòng)機(jī)的結(jié)構(gòu)很復(fù)雜,有很多移動(dòng)部件,必須在高溫下運(yùn)轉(zhuǎn),會(huì)經(jīng)歷各種各樣的運(yùn)轉(zhuǎn)狀況。因?yàn)樗鼈兊某杀咎?,所以期望壽命越長(zhǎng)越好。因此,穩(wěn)定的、可預(yù)測(cè)的性能就變得異常重要,因?yàn)闄C(jī)器的壽命依賴于此。例如,對(duì)故障飛機(jī)進(jìn)行保養(yǎng)維修會(huì)花掉航空公司或者空軍部隊(duì)一筆不小的錢(qián),但這種事情我們還必須做,因?yàn)槲覀円R(shí)別出飛機(jī)是否存在安全隱患。因此,飛機(jī)或者飛機(jī)發(fā)動(dòng)機(jī)以及其他設(shè)備的停機(jī)時(shí)間一定要降到最低,航空公司或者空軍部隊(duì)對(duì)此都有非常迫切的需求。
停機(jī)時(shí)間最小化策略包括準(zhǔn)備備件或后備發(fā)動(dòng)機(jī)快速割接時(shí)需要維修的設(shè)備、從診斷結(jié)果中快速識(shí)別需要更換的部件、針對(duì)問(wèn)題部件投資開(kāi)發(fā)更可靠的新版本。要想有效實(shí)施這3 種策略,必須得有數(shù)據(jù)。我們要用數(shù)據(jù)生成診斷算法,或者用數(shù)據(jù)作為輸入來(lái)診斷某個(gè)特定的問(wèn)題。工程部門(mén)可以使用傳感器數(shù)據(jù)準(zhǔn)確地定位問(wèn)題的原因,設(shè)計(jì)新的措施支持更長(zhǎng)、更可靠的操作。不管發(fā)動(dòng)機(jī)是飛機(jī)的,還是船只的,或者是陸地設(shè)備的,這些考慮因素都適用。
通過(guò)提取和分析詳細(xì)的發(fā)動(dòng)機(jī)運(yùn)轉(zhuǎn)數(shù)據(jù),我們可以精確地定位那些會(huì)導(dǎo)致立即失效的某些模式。然后我們就能識(shí)別出會(huì)降低發(fā)動(dòng)機(jī)壽命的時(shí)間分段模式以及更加頻繁的維修。多個(gè)變量的排列組合數(shù)目,特別是一段時(shí)間內(nèi)的排列組合數(shù)目,使得這類(lèi)數(shù)據(jù)分析活動(dòng)變成了一項(xiàng)挑戰(zhàn)。這個(gè)過(guò)程不僅會(huì)涉及到大數(shù)據(jù),就連隨之開(kāi)發(fā)出來(lái)的分析也會(huì)變得異常復(fù)雜和困難。以下是我們可以研究的一些問(wèn)題。
壓力驟然下降是否表示一定就會(huì)出問(wèn)題?
溫度在幾小時(shí)內(nèi)持續(xù)下降是否意味著還有其他問(wèn)題?
振動(dòng)水平異常是否意味著有問(wèn)題?
發(fā)動(dòng)機(jī)啟動(dòng)時(shí)的飛速轉(zhuǎn)動(dòng)是否讓某些部件的性能?chē)?yán)重受損,而且還會(huì)增加維修的次數(shù)?
幾個(gè)月內(nèi)油壓一直比較低,是否會(huì)使發(fā)動(dòng)機(jī)的某些部件受損?
結(jié)構(gòu)化數(shù)據(jù)內(nèi)缺少結(jié)構(gòu)性
傳感器數(shù)據(jù)給我們帶來(lái)了一個(gè)非常艱巨的挑戰(zhàn)。雖然我們收集到的數(shù)據(jù)是結(jié)構(gòu)化的,獨(dú)立的數(shù)據(jù)元素也很好理解,但元素之間的時(shí)間關(guān)系和模式卻根本無(wú)法理解。延時(shí)和無(wú)法測(cè)量的外部因素增加了問(wèn)題的復(fù)雜性。如果要考慮所有的信息,識(shí)別各種數(shù)據(jù)長(zhǎng)期的作用效果,這個(gè)過(guò)程會(huì)異常復(fù)雜。擁有結(jié)構(gòu)化數(shù)據(jù)并不一定能夠保證分析方法就是高度結(jié)構(gòu)化和標(biāo)準(zhǔn)化的。
在出現(xiàn)嚴(yán)重問(wèn)題的時(shí)候,先回頭去檢查當(dāng)時(shí)發(fā)生了什么,一直檢查到問(wèn)題自己露出馬腳,這種做法會(huì)非常奏效。傳感器的作用類(lèi)似于依靠飛機(jī)黑匣子的幫助診斷失事原因。發(fā)動(dòng)機(jī)傳感器數(shù)據(jù)可以用于診斷活動(dòng)和研究行為。從概念上講,相對(duì)于先前我們講到的汽車(chē)保險(xiǎn)案例中的信息服務(wù)設(shè)備,我們這里討論的傳感器是一種更復(fù)雜的形式。傳感器不斷感知周?chē)h(huán)境并獲得數(shù)據(jù)信息,這是大數(shù)據(jù)世界中反復(fù)討論的一個(gè)主題。雖然我們這里討論的是發(fā)動(dòng)機(jī),但傳感器還有數(shù)不清的各類(lèi)用途,這里討論的原則也同樣適用。
如果大量傳感器都長(zhǎng)時(shí)間重復(fù)著傳感器數(shù)據(jù)收集流程,那會(huì)產(chǎn)生大量豐富的分析數(shù)據(jù)。只要好好地分析這些數(shù)據(jù),就能發(fā)現(xiàn)設(shè)備的缺陷,就有機(jī)會(huì)主動(dòng)修復(fù)這些問(wèn)題。我們還可以把設(shè)備中的弱點(diǎn)先行識(shí)別出來(lái)。隨后,我們可以制定好流程,緩解這些發(fā)現(xiàn)帶來(lái)的問(wèn)題。這些措施帶來(lái)的收益不止是安全級(jí)別的提升,還會(huì)讓我們的成本下降。使用傳感器數(shù)據(jù),發(fā)動(dòng)機(jī)和設(shè)備都會(huì)更加安全,能夠提供服務(wù)的時(shí)間就會(huì)比較長(zhǎng),這樣運(yùn)營(yíng)會(huì)比較平穩(wěn),成本也會(huì)比較低。這是一種通贏的做法。
視頻游戲:遙測(cè)數(shù)據(jù)的價(jià)值
遙測(cè)數(shù)據(jù)是視頻游戲產(chǎn)業(yè)的一個(gè)術(shù)語(yǔ),用來(lái)描述捕捉游戲活動(dòng)的狀況。其概念與我們?cè)诘? 章所講的網(wǎng)絡(luò)大數(shù)據(jù)無(wú)異,這是因?yàn)檫b測(cè)數(shù)據(jù)收集的是玩家在游戲中的活動(dòng)情況。遙測(cè)數(shù)據(jù)的收集對(duì)象多數(shù)情況是在線游戲而非掌上游戲。
在曲棍球比賽中,遙測(cè)數(shù)據(jù)收集的是運(yùn)動(dòng)員在擊球進(jìn)門(mén)時(shí),何時(shí)進(jìn)的球,用的哪種擊球方法,球速多少。在戰(zhàn)爭(zhēng)游戲中,遙測(cè)數(shù)據(jù)收集的是用哪種槍械開(kāi)的火,在哪里開(kāi)的火,向哪個(gè)方向開(kāi)的火,槍械對(duì)各種東西的破壞程度。從理論上講,相關(guān)場(chǎng)景和活動(dòng)的所有細(xì)節(jié)都能夠被收集到。
視頻游戲制造商從中不僅可以很容易地了解到有多少客戶購(gòu)買(mǎi)了游戲軟件,還能知道游戲被玩了多少個(gè)小時(shí)。使用遙測(cè)數(shù)據(jù),游戲制造商可以了解到客戶的私人信息,他們實(shí)際的玩法,他們是如何與自己創(chuàng)建的游戲進(jìn)行交互的。我們收集到的游戲數(shù)據(jù)可能會(huì)很大,但視頻游戲行業(yè)已經(jīng)開(kāi)始積極地分析這些數(shù)據(jù)了。遙測(cè)數(shù)據(jù)對(duì)很多領(lǐng)域都產(chǎn)生了影響。從遙測(cè)數(shù)據(jù)的優(yōu)勢(shì)和用途來(lái)看,很容易發(fā)現(xiàn)它和網(wǎng)絡(luò)數(shù)據(jù)之間的相似性。下面我們來(lái)看一些例子。
使用遙測(cè)數(shù)據(jù)
許多游戲都通過(guò)訂閱模式掙錢(qián),因此維持刷新率對(duì)這些游戲就會(huì)非常重要。通過(guò)挖掘玩家的游戲模式,我們就可以了解到哪些游戲行為是與刷新率相關(guān)的,哪些是無(wú)關(guān)的。例如,也許在體育游戲比賽時(shí),使用某些輔助功能會(huì)大大提升刷新率。游戲制造商會(huì)采取措施來(lái)吸引玩家嘗試比賽,以誘使他們使用以前不曾使用過(guò)的功能。
遙測(cè)數(shù)據(jù)只會(huì)越來(lái)越大
現(xiàn)在,遙測(cè)數(shù)據(jù)捕捉的對(duì)象大多是控制手柄或鍵盤(pán)行為。隨著交互式游戲的發(fā)展,它們可以做到跟蹤玩家的動(dòng)作,而不是依賴于控制手柄,數(shù)據(jù)量也會(huì)因此激增。了解玩家在什么時(shí)間按下了什么按鈕,這類(lèi)數(shù)據(jù)量要比了解他身體上的某個(gè)部位在某個(gè)時(shí)刻的空間位置以及移動(dòng)方向和速度小得多。
比較新的游戲往往喜歡讓玩家花一點(diǎn)小錢(qián)在游戲過(guò)程中購(gòu)買(mǎi)物品,這就是所謂的微交易(microtransaction)。例如,一種特殊的武器只賣(mài)10 美分。我們可以對(duì)游戲進(jìn)行分析,識(shí)別出在哪些地方這類(lèi)微交易的成功率會(huì)比較高。也許游戲中的某個(gè)地點(diǎn)提供一種非常順手的武器,這種武器會(huì)引起玩家的瘋搶。我們可以使用屏幕的快速提示來(lái)告訴玩家現(xiàn)在有武器可以購(gòu)買(mǎi),這樣許多玩家都會(huì)選擇購(gòu)買(mǎi)該武器裝備。
與其他行業(yè)類(lèi)似,在視頻游戲產(chǎn)業(yè)中,客戶滿意度同樣也是一個(gè)大問(wèn)題。視頻游戲的獨(dú)特之處在于要設(shè)置一條非常非常精彩的行進(jìn)路線。游戲要給玩家提供挑戰(zhàn)機(jī)會(huì),但挑戰(zhàn)不能過(guò)度,過(guò)度的挑戰(zhàn)會(huì)讓玩家有挫敗感進(jìn)而放棄游戲。如果游戲過(guò)于簡(jiǎn)單或者過(guò)于復(fù)雜,玩家就會(huì)感到厭倦并轉(zhuǎn)向其他游戲。
通過(guò)游戲分析,我們能夠識(shí)別出游戲中哪些關(guān)卡每名玩家都能輕松過(guò)關(guān),哪些關(guān)卡即使是最頂級(jí)的玩家也很難過(guò)關(guān)。我們可以增加或減少這些地方的敵人,盡量使難度等級(jí)比較平衡。平衡的游戲難度等級(jí)可以為玩家提供更加一致的體驗(yàn),也會(huì)讓他們更有滿足感。這樣會(huì)導(dǎo)致更高的刷新率和更多的購(gòu)買(mǎi)行為。
通過(guò)遙測(cè)數(shù)據(jù),玩家還可以根據(jù)游戲風(fēng)格進(jìn)行分類(lèi)。使用這類(lèi)信息既可以設(shè)計(jì)出更優(yōu)秀的游戲,又能交叉銷(xiāo)售現(xiàn)有的產(chǎn)品。其中某個(gè)玩家族群可以全身心地投入到游戲通關(guān)中,而另一個(gè)玩家族群可以負(fù)責(zé)在通關(guān)前收集所有的獎(jiǎng)品,最后一個(gè)玩家族群則可以在收關(guān)前探索關(guān)卡中的所有角落。通過(guò)這種組合,每個(gè)玩家都可以在游戲中使用自己最喜歡的游戲方法進(jìn)行訓(xùn)練。
遙測(cè)數(shù)據(jù)能夠了解到玩家的認(rèn)知層次,基于此可以改變整個(gè)游戲業(yè)。游戲業(yè)已經(jīng)開(kāi)始使用遙測(cè)數(shù)據(jù),相信在不久的將來(lái)這個(gè)領(lǐng)域?qū)?huì)得到長(zhǎng)足的發(fā)展。依據(jù)遙測(cè)數(shù)據(jù)分析的效果,游戲制作和推廣的方式將會(huì)發(fā)生巨大的改變。
電信業(yè)與其他行業(yè):社交網(wǎng)絡(luò)數(shù)據(jù)的價(jià)值
與傳統(tǒng)數(shù)據(jù)相比,社交網(wǎng)絡(luò)數(shù)據(jù)本身就是一種大數(shù)據(jù)源,即使從很多方面來(lái)看,它更像是一種分析方法學(xué)。其中的原因在于,執(zhí)行社交網(wǎng)絡(luò)分析的過(guò)程需要處理已經(jīng)無(wú)比龐大的數(shù)據(jù)集,此外,還要使用行之有效的方法將處理規(guī)模提升幾個(gè)數(shù)量級(jí)。
有人會(huì)爭(zhēng)辯說(shuō),移動(dòng)運(yùn)營(yíng)商拿到的全部移動(dòng)電話的話單或者短信記錄本身就是大數(shù)據(jù),且這種數(shù)據(jù)可以用于多種用途。但是,社交網(wǎng)絡(luò)分析關(guān)注多個(gè)關(guān)系維度而非單個(gè)維度,從而可以做到更上一層樓。這也就是社交網(wǎng)絡(luò)分析可以把傳統(tǒng)的數(shù)據(jù)源變成大數(shù)據(jù)的原因。
對(duì)于現(xiàn)代電話公司,僅僅看通話量是不夠的,電話公司還需要把通話作為獨(dú)立實(shí)體進(jìn)行分析。社交網(wǎng)絡(luò)分析首先要看有哪些人參與了通話,然后再用更深入的視角進(jìn)行分析。我們不僅要知道自己給誰(shuí)打了電話,還要知道我致電的那個(gè)人還給誰(shuí)打了電話,這些人接下來(lái)又打給了什么人,依此類(lèi)推。要想得到社交網(wǎng)絡(luò)的全景圖,我們就得觸及系統(tǒng)能夠處理的上限。多層客戶與客戶之間的導(dǎo)航關(guān)聯(lián)以及多層通話都會(huì)使得數(shù)據(jù)量倍增。此外,它還增加了分析的難度,尤其是使用傳統(tǒng)工具時(shí)的分析難度。
同樣的概念也適用于社交網(wǎng)絡(luò)站點(diǎn)。通過(guò)分析社交網(wǎng)絡(luò)中的某個(gè)成員,不難分析出這個(gè)成員有多少關(guān)聯(lián)關(guān)系,她發(fā)短信的頻率,她訪問(wèn)站點(diǎn)的頻率,以及其他一些指標(biāo)。但是,當(dāng)成員與其朋友、與朋友的朋友、與朋友的朋友的朋友都有關(guān)聯(lián)關(guān)系時(shí),這時(shí)了解網(wǎng)絡(luò)邊界所需要的處理量就會(huì)大得多。
一千個(gè)成員或用戶不難跟蹤。但是,他們之間的直接關(guān)聯(lián)關(guān)系會(huì)上升到百萬(wàn)級(jí)別,而再考慮到“朋友的朋友”則會(huì)升至十億級(jí)別。這就是社交網(wǎng)絡(luò)分析是一個(gè)大數(shù)據(jù)問(wèn)題的原因所在。今天,已經(jīng)有了大量的應(yīng)用來(lái)分析這種關(guān)聯(lián)關(guān)系。
使用社交網(wǎng)絡(luò)數(shù)據(jù)
社交網(wǎng)絡(luò)數(shù)據(jù)及分析有一些影響深遠(yuǎn)的應(yīng)用,其中一種重要的應(yīng)用正在改變著公司評(píng)價(jià)客戶的行為。和以前只看個(gè)人的情況不同,現(xiàn)在參考的是他們的網(wǎng)絡(luò)整體價(jià)值。我們這里談的例子也同樣適用于許多其他的行業(yè),在這些行業(yè)里我們同樣需要了解人與人或者群體與群體之間的關(guān)系,但現(xiàn)在我們關(guān)注的是手機(jī)用戶,因?yàn)樵谶@里這種方法的應(yīng)用范圍最廣。
假定電信運(yùn)營(yíng)商有一個(gè)價(jià)值相對(duì)較低的用戶。這名用戶只有基本的通話需求,不會(huì)為運(yùn)營(yíng)商帶來(lái)任何增值收入。事實(shí)也是,不能創(chuàng)造利潤(rùn)的客戶就是沒(méi)有價(jià)值的。運(yùn)營(yíng)商以往的作法是,只根據(jù)他或她的個(gè)人賬戶來(lái)對(duì)其進(jìn)行評(píng)價(jià)。以前如果這名客戶打電話投訴或者威脅要更換運(yùn)營(yíng)商,公司可能不會(huì)挽留他,因?yàn)樗鼈冋J(rèn)為這名客戶并不值得挽留。
使用社交網(wǎng)絡(luò)分析技術(shù),雖然我們的客戶通話賬單看似價(jià)值不高,但我們可以識(shí)別出客戶曾經(jīng)和某些人通過(guò)電話,而這些人是有著廣泛交際圈的重量級(jí)人物。換句話說(shuō),客戶聯(lián)系對(duì)運(yùn)營(yíng)商而言是非常有價(jià)值的信息。研究表明,一旦某位成
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03