
車聯(lián)網(wǎng)的大數(shù)據(jù)之囧_數(shù)據(jù)分析師培訓(xùn)
在第五期《車聯(lián)wang談》中,我們談到了車聯(lián)網(wǎng)大數(shù)據(jù)在“車端”的囧態(tài)。接下來(lái),咱們繼續(xù)聊聊“道路端”和“人端”的大數(shù)據(jù)。
“道路端”的大數(shù)據(jù),最主要的應(yīng)用主要是靜態(tài)的地理信息數(shù)據(jù)和動(dòng)態(tài)的實(shí)時(shí)交通信息。車音網(wǎng)CEO王力劭(以下簡(jiǎn)稱老王)在第二期《車聯(lián)wang談》中也介紹過(guò),這也是未來(lái)無(wú)人駕駛技術(shù)的一個(gè)重要技術(shù)依賴。
靜態(tài)地理信息數(shù)據(jù),就是俗稱的“導(dǎo)航地圖”和“興趣點(diǎn)”。目前,除了官方測(cè)繪部門,國(guó)內(nèi)主要的正版導(dǎo)航地圖服務(wù)提供商有高德、四維圖新、易圖通等,他們都具有測(cè)繪資質(zhì),能夠生成各類地圖。當(dāng)然,各大型互聯(lián)網(wǎng)公司如阿里、騰訊、百度、360等也開始以注資、合作的方式,染指各類地圖服務(wù)提供商。順便說(shuō)一句,地圖測(cè)繪和應(yīng)用都涉及到國(guó)家安全問(wèn)題。因此,國(guó)家通過(guò)“測(cè)繪許可證”和“應(yīng)用許可證”來(lái)進(jìn)行管控?!芭d趣點(diǎn)”是另一類地理信息,主要關(guān)注的是某個(gè)地理位置周邊所提供的服務(wù)。導(dǎo)航地圖可以明確標(biāo)定一個(gè)具體的位置,而興趣點(diǎn)則關(guān)心這個(gè)位置及其周邊位置如何滿足用戶的需求。比如,大眾點(diǎn)評(píng)就是一個(gè)典型的興趣點(diǎn)應(yīng)用,當(dāng)我們導(dǎo)航到“朝內(nèi)81號(hào)”,它就可以給我們提供周邊“快餐店”、“旅店”等服務(wù)信息。靜態(tài)的地理信息數(shù)據(jù),數(shù)據(jù)量雖然大,實(shí)際上算不上我們所謂的“大數(shù)據(jù)”。因?yàn)槠潇o態(tài)性,我們無(wú)法通過(guò)數(shù)據(jù)在時(shí)空變換的過(guò)程中得出具體的規(guī)律。我們所要解決的問(wèn)題,只是地圖位置以及興趣點(diǎn)的更新速度要能夠跟得上時(shí)代的變化——要避免當(dāng)新路都建成使用了,地圖還只“知道”老路;不要飯店都換老板改名稱了,興趣點(diǎn)卻沒有變化。所以,未來(lái)我們還是應(yīng)以大視野思維來(lái)打造車聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)系統(tǒng),要把地理信息大數(shù)據(jù)與移動(dòng)互聯(lián)的地理信息整合起來(lái)。而這需要建立整個(gè)產(chǎn)業(yè)生態(tài),形成“數(shù)據(jù)+技術(shù)+服務(wù)”一體化車聯(lián)網(wǎng)地理信息服務(wù)系統(tǒng),整合數(shù)據(jù)獲取、處理、分析、應(yīng)用、服務(wù),為用戶提供實(shí)時(shí)動(dòng)態(tài)的服務(wù)。
動(dòng)態(tài)交通信息主要是通過(guò)攝像頭、埋設(shè)在路口的感應(yīng)線圈以及加裝在汽車之上的定位和通信設(shè)備進(jìn)行車輛位置的實(shí)時(shí)監(jiān)控。監(jiān)控目標(biāo)有兩種,一種是關(guān)注汽車個(gè)體的運(yùn)動(dòng)軌跡,主要用于安全和管理。比如出租汽車的防盜監(jiān)控設(shè)備,以及國(guó)家和部分企業(yè)通過(guò)監(jiān)控平臺(tái)實(shí)施的運(yùn)營(yíng)車輛管理。這部分,也算不上是具有分析推導(dǎo)價(jià)值的大數(shù)據(jù)。另一種是關(guān)注某個(gè)區(qū)域的實(shí)時(shí)交通狀況及變化趨勢(shì),這個(gè)可就是有用的大數(shù)據(jù)了。
國(guó)外一些實(shí)時(shí)交通移動(dòng)APP軟件例如WAZE就具有眾籌式的動(dòng)態(tài)交通大數(shù)據(jù)采集和智能交通信息分析引導(dǎo)功能。當(dāng)大量車主安裝并在駕駛時(shí)開啟這個(gè)應(yīng)用,每個(gè)安裝者都可以把自己在當(dāng)前路段的移動(dòng)速度、位置燈信息匿名發(fā)送到后臺(tái)。后臺(tái)將這類數(shù)據(jù)大量采集后,通過(guò)算法就可以知道各個(gè)路段的車速快慢、車輛擁擠程度以及未來(lái)交通變化趨勢(shì)。
在我國(guó),實(shí)時(shí)交通大數(shù)據(jù)卻有著它的囧境,根本原因是數(shù)據(jù)采集依舊困難。路口感應(yīng)線圈、攝像頭的建設(shè)都需要大量的資金,而如果架設(shè)的范圍不夠廣,采集的數(shù)據(jù)有限,那么大數(shù)據(jù)推導(dǎo)過(guò)程就會(huì)有嚴(yán)重偏差。在汽車上安裝實(shí)時(shí)定位和通信裝置是最好的辦法,比如象國(guó)外的WAZE軟件一樣,而真實(shí)國(guó)情是我們并沒有習(xí)慣去“在路上通過(guò)幫助別人來(lái)幫助自己”,連開車大家都恨不得加塞兒比車技,所以這種眾籌式的交通互助應(yīng)用在我國(guó)難以推行開。路況電臺(tái),是我國(guó)一個(gè)類似WAZE的應(yīng)用,但是實(shí)際上安裝和使用量還遠(yuǎn)達(dá)不到WAZE的水平。目前,北京等大城市,交管部門基本上還是靠出租車上的安防設(shè)備所自帶的定位通信信息進(jìn)行采集,而這種數(shù)據(jù)就具有嚴(yán)重的局限性。除了量少以外,出租司機(jī)的活動(dòng)范圍也基本集中在城市的某些繁華的“熱區(qū)”,這種具有區(qū)域不均勻特性的局限性數(shù)據(jù)顯然不是能夠用于推導(dǎo)規(guī)律的普適性大數(shù)據(jù)。
除了數(shù)據(jù)采集方面的問(wèn)題,目前的動(dòng)態(tài)尋路算法對(duì)于復(fù)雜實(shí)時(shí)路況大數(shù)據(jù)還難以做到高可用的預(yù)測(cè)性。舉個(gè)簡(jiǎn)單的例子,根據(jù)某個(gè)區(qū)域“二環(huán)堵但三環(huán)通”的狀態(tài),實(shí)時(shí)導(dǎo)航系統(tǒng)會(huì)讓我放棄二環(huán)而繞道三環(huán)。老王費(fèi)了九牛二虎之力花了20分鐘通過(guò)連接線繞道三環(huán),也許此時(shí)三環(huán)堵,二環(huán)卻開始通暢了。實(shí)時(shí)導(dǎo)航系統(tǒng)也許會(huì)無(wú)恥地要求你原路再返回二環(huán)去……生活瞬間變得不美好了。另外,當(dāng)交通系統(tǒng)超負(fù)荷運(yùn)轉(zhuǎn)時(shí),大數(shù)據(jù)也幫不了我們什么了。由于我國(guó)各個(gè)城市的經(jīng)濟(jì)發(fā)展不平衡,所以人們更愿意在大城市生活、打拼,結(jié)果,就是我們經(jīng)常聽到的大城市的負(fù)荷嚴(yán)重超標(biāo),這其中包括交通容量超負(fù)荷。生活中最常遇到的經(jīng)驗(yàn)是,每到上下班高峰時(shí)期,從智能交通軟件商看,老王回家的所有道路都是“一片紅”,系統(tǒng)規(guī)劃給你的路線,基本意思是“您隨便走哪兒都行”。因?yàn)?,您走哪兒其?shí)都不行。
所以,道路側(cè)的大數(shù)據(jù)也面臨應(yīng)用囧境啊。畢竟,車聯(lián)網(wǎng)的應(yīng)用關(guān)鍵是實(shí)時(shí)提取路況和車輛的動(dòng)態(tài)信息。只有充分搜集了動(dòng)態(tài)信息,才能做到車輛監(jiān)管、出行路線建議以及交通流量預(yù)測(cè)等綜合服務(wù)。顯然,目前道路信息采集的不足給用戶帶來(lái)了很多不便,這也是為什么大多汽車信息服務(wù)提供的大多是出行導(dǎo)航、通信、娛樂(lè)等基本服務(wù),或者緊急情況救援等特殊服務(wù),而人們最需要的交通出行建議服務(wù)卻不能有效提供。
最后,咱們來(lái)談車聯(lián)網(wǎng)大數(shù)據(jù)在“人”這一側(cè)的應(yīng)用狀況。一個(gè)有意義的設(shè)想是:當(dāng)人的駕駛習(xí)慣以及車輛路徑能夠被記錄下來(lái),那么,汽車制造者、維保者以及保險(xiǎn)機(jī)構(gòu)就能夠針對(duì)這些數(shù)據(jù)去給這個(gè)駕駛員進(jìn)行行為數(shù)據(jù)“畫像”。然后,通過(guò)大量數(shù)據(jù)分析,就可以精確做到車輛改進(jìn)、維保策略制定以及對(duì)該駕駛者進(jìn)行保險(xiǎn)價(jià)格評(píng)估。通過(guò)對(duì)重大數(shù)據(jù)的挖掘,用戶和車企及相關(guān)機(jī)構(gòu)的關(guān)系會(huì)進(jìn)一步的透明化和智能化。說(shuō)到挖掘,問(wèn)題自然而然就來(lái)了……別瞎聯(lián)想,老王說(shuō)的問(wèn)題不是“挖掘技術(shù)哪家強(qiáng)”,而是,為何用戶允許你去挖掘他的數(shù)據(jù)?
最近,市面上出現(xiàn)了大量的OBD(On-Board Diagnostics,車載診斷裝置)形態(tài)產(chǎn)品,就是專門用于用戶駕駛數(shù)據(jù)收集的終端。OBD,就是一個(gè)小盒子,可以插在汽車中控臺(tái)的一個(gè)標(biāo)準(zhǔn)診斷口上,然后從診斷口獲取源源不斷的汽車運(yùn)行數(shù)據(jù)。比如發(fā)動(dòng)機(jī)數(shù)據(jù)、空調(diào)數(shù)據(jù)、加速剎車以及設(shè)備狀態(tài)等,這些數(shù)據(jù)可以通過(guò)藍(lán)牙或無(wú)線和手機(jī)上的APP直接溝通。有些OBD產(chǎn)品會(huì)內(nèi)置移動(dòng)網(wǎng)絡(luò),可以直接把數(shù)據(jù)送到互聯(lián)網(wǎng)后臺(tái)。市面上的這些產(chǎn)品被冠以各種名字,比如“路寶盒子”、“iVoka Mini X”、“Golo”等,產(chǎn)品設(shè)計(jì)者的目的是將OBD作為一個(gè)能夠“討好”用戶的產(chǎn)品,給用戶一些實(shí)用的功能從而讓用戶用起來(lái)。比如,汽車非法移動(dòng)時(shí)的自動(dòng)報(bào)警、安全區(qū)域邊界、駕駛行為評(píng)比社交等。為了這些功能,商家除了向用戶收取產(chǎn)品的一次性銷售費(fèi)用,還要用戶每年支付一定的通信費(fèi)用。然而,用戶是否真的對(duì)這種服務(wù)感興趣?除了發(fā)燒友,有多少用戶真的會(huì)使用這種服務(wù)?
OBD的規(guī)?;褂茫_實(shí)可以產(chǎn)生大量極為可貴的駕駛行為大數(shù)據(jù),甚至每個(gè)個(gè)體的數(shù)據(jù)匯總后,還能夠?qū)步煌óa(chǎn)生重大影響,但如何能夠讓大量用戶安裝,卻是一個(gè)很難破解的命題。一個(gè)產(chǎn)品的存在需要有三個(gè)要素,一是用戶要覺得它有價(jià)值,二是它要能夠?yàn)樯a(chǎn)者帶來(lái)收益(可能是現(xiàn)金收益,也可能是從其他地方交叉補(bǔ)貼后帶來(lái)的價(jià)值延長(zhǎng)收益,或者是一個(gè)形成好名聲所產(chǎn)生的品牌關(guān)聯(lián)收益等),三是該產(chǎn)品推廣應(yīng)用的代價(jià)。顯然,OBD產(chǎn)品滿足第二條特性,但是第一條特性的滿足度相對(duì)不足,所以第三點(diǎn)特性——推廣起來(lái)的代價(jià)也就非常高。達(dá)不到大量的覆蓋和激活,這個(gè)大數(shù)據(jù)的應(yīng)用也將面臨很大的囧境。老王預(yù)測(cè),隨著時(shí)間的推移,市場(chǎng)需求的積累,各個(gè)汽車廠都會(huì)脫離OBD外接模塊模式(不是刪除OBD接口)。他們會(huì)主動(dòng)去開放一些汽車運(yùn)行數(shù)據(jù),并且會(huì)分級(jí)提供給授權(quán)的開發(fā)商進(jìn)行“只讀”使用,或者提供給相對(duì)封閉、安全的由汽車自有的APP進(jìn)行使用。OBD設(shè)備,目前看來(lái)應(yīng)當(dāng)是一個(gè)過(guò)渡產(chǎn)品,即使未來(lái)有一天能夠覆蓋大量用戶,但由于各個(gè)OBD廠商的平臺(tái)不統(tǒng)一,缺乏開放的平臺(tái)協(xié)議,駕駛行為數(shù)據(jù)庫(kù)不能實(shí)現(xiàn)互通。所以這種大數(shù)據(jù)也具有很大的割裂性,如果要到達(dá)可用的那一天,還需要經(jīng)歷相當(dāng)長(zhǎng)的時(shí)間。另外,所有這一切,完全是在忽略用戶對(duì)隱私的警覺性以及汽車核心數(shù)據(jù)安全因素上進(jìn)行的理想雙胎假設(shè)。
所以,從推論來(lái)看,車聯(lián)網(wǎng)行業(yè)的大數(shù)據(jù)涉及的范疇非常廣,有效組織并利用這些大數(shù)據(jù)確實(shí)具備跨時(shí)代的意義,它甚至?xí)?duì)汽車制造業(yè)的升級(jí)乃至汽車行業(yè)的革命起到至關(guān)重要的作用。然而,這些大數(shù)據(jù)從何而來(lái),如何真正組織起來(lái),卻是今天我們所面臨的重大課題。這好比一個(gè)囧境,讓老鼠能夠有效躲避貓的最佳方法是給貓的脖子上系個(gè)鈴鐺,但是,這個(gè)鈴鐺如何系在貓脖子上,卻是老鼠先要解決的問(wèn)題。現(xiàn)實(shí)要老鼠們不要狂熱地只去暢想那個(gè)鈴鐺的作用,而是要?jiǎng)?wù)實(shí)地去考慮系鈴鐺的策略。正如大數(shù)據(jù)之對(duì)于車聯(lián)網(wǎng),誰(shuí)能腳踏實(shí)地而卓有成效的耕耘,誰(shuí)才能笑到最后。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11