
當(dāng)你開車路過一家餐廳的停車場(chǎng)時(shí),你的手機(jī)屏幕上彈出了這家餐廳的當(dāng)日特價(jià)菜品推薦,這種體驗(yàn)是不是很棒?如果賭場(chǎng)老板把發(fā)牌人忘記付給你的20美元親自送還給你,你的心里是不是有點(diǎn)兒小激動(dòng)?如果在線視頻游戲能夠把和我們玩法相近的用戶即刻告知我們,這世界會(huì)不會(huì)變得很美妙?你是不是要下調(diào)汽車保險(xiǎn)費(fèi)率?大數(shù)據(jù)能讓這一切變成現(xiàn)實(shí)。
網(wǎng)絡(luò)數(shù)據(jù)即使不是最原始的大數(shù)據(jù)源,也是使用最廣泛、認(rèn)可度最高的大數(shù)據(jù)源。除此之外,還有很多大數(shù)據(jù)源,它們都有各自的使用價(jià)值。其中一些廣為人知,而另一些幾乎沒有名氣。我們?cè)诖艘栌帽菊碌钠黄饋?lái)回顧除網(wǎng)絡(luò)數(shù)據(jù)以外的其他9 種大數(shù)據(jù)源以及它們的用途。我們將站在一個(gè)較高的層次上講解這部分內(nèi)容,意圖是在簡(jiǎn)單描述各類數(shù)據(jù)源的基礎(chǔ)上,回顧每種大數(shù)據(jù)源的應(yīng)用與商業(yè)含義。
我們發(fā)現(xiàn)了一個(gè)非常明顯的趨勢(shì),各行各業(yè)雖然生成了許多大數(shù)據(jù)源,但其底層的支撐技術(shù)卻是相同的。而且,不同行業(yè)還可以使用相同的大數(shù)據(jù)源。大數(shù)據(jù)并非只有單一的用途,它的影響將會(huì)非常深遠(yuǎn)。
我們將要討論以下幾種大數(shù)據(jù)源。
汽車保險(xiǎn)業(yè):車載信息服務(wù)數(shù)據(jù)的價(jià)值。
多個(gè)行業(yè):文本數(shù)據(jù)的價(jià)值。
多個(gè)行業(yè):時(shí)間數(shù)據(jù)與位置數(shù)據(jù)的價(jià)值。
零售制造業(yè):RFID 數(shù)據(jù)的價(jià)值。
電力行業(yè):智能電網(wǎng)數(shù)據(jù)的價(jià)值。
博彩業(yè):籌碼跟蹤數(shù)據(jù)的價(jià)值。
工業(yè)發(fā)動(dòng)機(jī)和設(shè)備:傳感器數(shù)據(jù)的價(jià)值。
視頻游戲:遙測(cè)數(shù)據(jù)的價(jià)值。
電信業(yè)與其他行業(yè):社交網(wǎng)絡(luò)數(shù)據(jù)的價(jià)值。
汽車保險(xiǎn)業(yè):車載信息服務(wù)數(shù)據(jù)的價(jià)值
車載信息服務(wù)在汽車保險(xiǎn)行業(yè)中的關(guān)注度非常高。車載信息服務(wù)是通過汽車內(nèi)置的傳感器和黑盒來(lái)收集和掌握車輛的相關(guān)信息。我們可以配置不同的方案,使用黑盒來(lái)監(jiān)測(cè)所有的汽車數(shù)據(jù)。我們可以監(jiān)測(cè)車速、行駛里程,以及汽車是否安裝了緊急制動(dòng)系統(tǒng)。車載信息服務(wù)數(shù)據(jù)能夠幫助保險(xiǎn)公司更好地理解客戶的風(fēng)險(xiǎn)等級(jí),并設(shè)置合理的保險(xiǎn)費(fèi)率。如果徹底地忽略隱私問題,車載信息服務(wù)裝置可以跟蹤到汽車去過的所有地點(diǎn)、何時(shí)到達(dá)的、以多快的速度、使用了汽車的哪些功能等。
車載信息服務(wù)可以潛在地降低司機(jī)的保險(xiǎn)費(fèi)率,并提升保險(xiǎn)公司的收益。它是怎樣做到在降低費(fèi)率的同時(shí)提升收益呢?答案就在于保險(xiǎn)公司要根據(jù)風(fēng)險(xiǎn)評(píng)估來(lái)進(jìn)行保險(xiǎn)定價(jià)。傳統(tǒng)的風(fēng)險(xiǎn)評(píng)估方法使用的是年齡、人口統(tǒng)計(jì)特征以及個(gè)人意外傷害歷史這類數(shù)據(jù),它們只能提供高層次的概要信息。對(duì)于駕駛記錄沒有任何問題的車主,傳統(tǒng)方法根本沒辦法把他們和附近的其他人區(qū)分開。
保險(xiǎn)公司要未雨綢繆,并做好最壞的打算。它們要弄清楚哪些人放在哪個(gè)風(fēng)險(xiǎn)范圍上是最安全的,一般情況下,它們會(huì)先假定這些人的風(fēng)險(xiǎn)是位于該風(fēng)險(xiǎn)范圍較高的一端。汽車保險(xiǎn)公司對(duì)車主的行為習(xí)慣和實(shí)際風(fēng)險(xiǎn)了解得越詳細(xì),風(fēng)險(xiǎn)范圍就會(huì)越窄,同時(shí)認(rèn)定范圍內(nèi)出現(xiàn)需要提升費(fèi)率的最壞情況的可能性就會(huì)比較小。這就是為什么可以同時(shí)降低保險(xiǎn)費(fèi)率和提升收益的原因。如果保險(xiǎn)公司認(rèn)為投保個(gè)體的風(fēng)險(xiǎn)較好,那么保險(xiǎn)公司將可以更好地了解每個(gè)人的風(fēng)險(xiǎn)狀況,預(yù)計(jì)必須支出的保費(fèi)就不會(huì)發(fā)生太大變化。
全球很多國(guó)家的保險(xiǎn)公司都在使用車載信息服務(wù),而且數(shù)量越來(lái)越多。早期項(xiàng)目的注意力放在從汽車上收集最少的信息,例如,它們并不關(guān)心汽車去過什么地方。早期項(xiàng)目跟蹤的是汽車開了多遠(yuǎn)、什么時(shí)候開的車、是否超速和是否使用了大量的緊急制動(dòng)。這些信息都是非?;镜男畔?,不牽涉到個(gè)人隱私,是故意設(shè)計(jì)成這樣的。因?yàn)楸苊饬耸占叨让舾械男畔?,所以才?huì)被廣泛地接受。這個(gè)道理也同樣適用于商業(yè)車隊(duì)。如果保險(xiǎn)公司了解到公司車隊(duì)更多的用車情況,那么它為公司車隊(duì)確定保險(xiǎn)費(fèi)率也就更容易。
車載信息服務(wù)數(shù)據(jù)最初是作為一種工具出現(xiàn)的,它可以幫助車主和公司獲得更好的、更有效的車輛保險(xiǎn)。再過一段時(shí)間,等到許多交通工具都安裝了車載信息服務(wù)裝置后,那時(shí)保險(xiǎn)業(yè)以外的行業(yè)也可以使用車載信息服務(wù)數(shù)據(jù)了。現(xiàn)在,公共汽車已經(jīng)有了車載計(jì)算機(jī)管理系統(tǒng),但是車載信息服務(wù)設(shè)備可以將其提升到一個(gè)新的層次。車載信息服務(wù)數(shù)據(jù)還有一些有趣的應(yīng)用,我們來(lái)看一下這些應(yīng)用。
使用車載信息服務(wù)數(shù)據(jù)
如果車載信息服務(wù)真的開始大規(guī)模應(yīng)用,一定會(huì)出現(xiàn)許多令人興奮的分析應(yīng)用。想象一下,以后全國(guó)有數(shù)以千萬(wàn)計(jì)的汽車都安裝了車載信息服務(wù)裝置,那時(shí)候第三方研究公司會(huì)以匿名的方式為客戶收集非常詳細(xì)的車載通信數(shù)據(jù)。與為保險(xiǎn)收集的有限數(shù)據(jù)不同,這時(shí)數(shù)據(jù)收集是以分鐘或秒為頻率,且收集內(nèi)容包括但不限于速度、位置、方向和其他有用的信息。
無(wú)論交通是否阻塞,無(wú)論什么日期,這種數(shù)據(jù)反饋方式都會(huì)提供大量的車載通信信息。研究人員可以知道每輛車在道路上的行駛速度,他們還可以知道車流開始的時(shí)間、結(jié)束的時(shí)間,以及持續(xù)的時(shí)間。這種真實(shí)的交通流信息視圖將會(huì)多么令人驚訝!試想這會(huì)對(duì)交通阻塞和道路系統(tǒng)規(guī)劃的研究產(chǎn)生多么大的影響!
無(wú)心插柳柳成陰
車載信息服務(wù)數(shù)據(jù)的多種用途只是一個(gè)例子,它說明了可以用最初預(yù)見不到的方式來(lái)使用大數(shù)據(jù)。對(duì)于某種特定的數(shù)據(jù)源,我們最后發(fā)現(xiàn)它最有效的用途可能與其創(chuàng)建之初的用途大相徑庭。面對(duì)我們碰到的每一類大數(shù)據(jù)源,我們要開拓思路,多想想常規(guī)之外的其他用途。
如果研究人員能夠掌握大量汽車在每一個(gè)高峰時(shí)段、每一天、每個(gè)城市中的動(dòng)向,他們就能非常清晰地判斷出車流產(chǎn)生的前因后果。此外,還能查明下述問題的答案。
一個(gè)在路中央的輪胎會(huì)對(duì)交通產(chǎn)生什么影響?
左側(cè)車道堵車會(huì)發(fā)生什么?
如果路口的交通燈不同步,會(huì)產(chǎn)生何種結(jié)果?
哪些十字路口雖然按照預(yù)期設(shè)定方式工作,但通行時(shí)間的設(shè)計(jì)仍然不合理?
如果某條道路堵塞,堵塞會(huì)以多快的速度蔓延到其他道路?
即使我們集中精力投入到昂貴的測(cè)試中,現(xiàn)在要想有效地研究諸如此類的問題也幾乎是不可能的。除非我們安排人手來(lái)實(shí)際地監(jiān)測(cè)每一條道路,記錄下所有的信息,只有這樣我們才能解決交通堵塞的問題。或者,我們可以安裝大量的傳感器來(lái)監(jiān)測(cè)過往的車輛,還可以安裝視頻攝像頭,但這些選擇因?yàn)槌杀締栴}被嚴(yán)重限制了推廣。
交通道路工程師做夢(mèng)都想得到我們所講的車載通信信息。如果車載通信裝置變得隨處可見,那任何交通擁堵的地方都能被發(fā)現(xiàn)。城市道路和交通管理系統(tǒng)的革新,以及城市道路建設(shè)規(guī)劃,都將惠及普通大眾。車載通信剛開始出現(xiàn)時(shí)是為了滿足保險(xiǎn)定價(jià)的需求,但有了它還可以緩解交通壓力和駕駛員堵車時(shí)焦急等待的心情,它的存在終將使高速公路的管理模式發(fā)生革命性的改變。
多個(gè)行業(yè):文本數(shù)據(jù)的價(jià)值
文本是最大的也是最常見的大數(shù)據(jù)源之一。想想我們周圍有多少文本信息的存在,電子郵件、短信、微博、社交媒體網(wǎng)站的帖子、即時(shí)通信、實(shí)時(shí)會(huì)議以及可以轉(zhuǎn)換成文本的錄音信息。文本數(shù)據(jù)是現(xiàn)在結(jié)構(gòu)化程度最低的,也是最大的大數(shù)據(jù)源。幸運(yùn)的是,我們?cè)隈{馭文本數(shù)據(jù)、利用文本數(shù)據(jù)來(lái)更好地做商業(yè)決策方面已經(jīng)做了很多工作。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
左偏態(tài)分布轉(zhuǎn)正態(tài)分布:方法、原理與實(shí)踐 左偏態(tài)分布轉(zhuǎn)正態(tài)分布:方法、原理與實(shí)踐 在統(tǒng)計(jì)分析、數(shù)據(jù)建模和科學(xué)研究中,正態(tài)分 ...
2025-07-21CDA 數(shù)據(jù)分析師的職業(yè)生涯規(guī)劃:從入門到卓越的成長(zhǎng)之路 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的當(dāng)下,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要來(lái)源,而 CD ...
2025-07-21MySQL執(zhí)行計(jì)劃中rows的計(jì)算邏輯:從原理到實(shí)踐 MySQL 執(zhí)行計(jì)劃中 rows 的計(jì)算邏輯:從原理到實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)的查詢優(yōu)化中 ...
2025-07-21在AI滲透率超85%的2025年,企業(yè)生存之戰(zhàn)就是數(shù)據(jù)之戰(zhàn),CDA認(rèn)證已成為決定企業(yè)存續(xù)的生死線!據(jù)麥肯錫全球研究院數(shù)據(jù)顯示,AI驅(qū) ...
2025-07-2035歲焦慮像一把高懸的利刃,裁員潮、晉升無(wú)望、技能過時(shí)……當(dāng)職場(chǎng)中年危機(jī)與數(shù)字化浪潮正面交鋒,你是否發(fā)現(xiàn): 簡(jiǎn)歷投了10 ...
2025-07-20CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15