
大數(shù)據(jù)與人工相結合,谷歌地圖夠精準嗎
我們使用的導航地圖近十年已經(jīng)發(fā)生了翻天覆地的變化。上世紀90年代,我們還在用紙質(zhì)地圖尋找目的地。而現(xiàn)在基本只需要服從Siri或她的谷歌競爭對手的導航指令。
“地面真相”算法和街景服務
不過這些導航指令背后隱藏著大多數(shù)人無法想象的眾多數(shù)據(jù)。目前由于谷歌已經(jīng)獲得了極其龐大的地圖數(shù)據(jù),他們開始采用大數(shù)據(jù)方法,或谷歌稱之為“地面真相”的算法和細致的人工努力相結合的方法,為用戶提供更詳盡的地圖信息。該項目于2008年推出,但它一直處于保密狀態(tài),直到幾年前才公開。它持續(xù)增長,現(xiàn)已覆蓋51個國家。這一算法在提取衛(wèi)星、空中和街景視圖的信息時發(fā)揮了巨大的作用。
谷歌“地面真相”算法可以識別的街景信息
谷歌2007年推出了街景服務,通過讓人們看到目的地周圍的環(huán)境來提高用戶體驗。谷歌地圖副總裁布萊恩·麥克倫登(Brian McClendon)。表示,“我們很快就意識到做地圖的最佳途徑之一,就是擁有全世界的街頭照片?!?/span>
隨著街景收集數(shù)據(jù)的增長,抽查他們的數(shù)據(jù)已經(jīng)不是很好的解決方案。谷歌地圖產(chǎn)品經(jīng)理馬尼克·古普塔(Manik Gupta)表示,現(xiàn)在街景車已經(jīng)行駛700多萬英里,覆蓋美國99%的公共道路,“它實際上使我們能夠利用算法建立提取信息之外的新數(shù)據(jù)層?!?/span>
這些算法借用計算機視覺和機器學習的方法來提取路邊的街道編號、企業(yè)名稱、限速交通標志等細節(jié)信息。 不過很多信息還是非常難以提取,麥克倫登表示,“停止標記常常很容易被忽略。轉(zhuǎn)彎限制對于導航來說也很重要,但對于谷歌的捕捉算法還很難處理。因為這些標記箭頭可能是被畫在道路上,它們可以是不同的顏色和大小。車道標記的分析更難,因為他們并不一致?!?/span>
谷歌地圖普通用戶不可見的轉(zhuǎn)彎限制信息。
路牌也是非常重要的信息。駕駛者聽到的導航指示如果能匹配他們看到的,那么他們就能更好的被指引。但有時街道標志使用的拼寫或縮寫導致了很多麻煩。“匹配標志上的文字實際上是一個很困難的任務。”
另外,谷歌的算法還可以利用衛(wèi)星和航空影像提取建筑物的輪廓和高度。美國大多數(shù)的建筑物現(xiàn)在都可以在谷歌地圖上找到。對于像西雅圖太空針塔這樣的標志性建筑,計算機視覺技術已經(jīng)可以提取出詳細的3D模型。谷歌曾表示,它收購高分辨率衛(wèi)星圖像公司Skybox就是為了提高其地圖的準確性。
計算機視覺技術提取的標志性建筑物3D模型
職業(yè)地圖糾錯團隊和MapMaker計劃
然而,衛(wèi)星和算法的能力還是有限。為了提供最好的體驗,谷歌雇傭了一只由人類組成的團隊,手動檢查并使用內(nèi)部程序Atlas糾正地圖的錯誤。谷歌公司以外很少有人見過這一應用。
這一人工檢查團隊看到的地圖類似于谷歌地圖的衛(wèi)星地圖混合視圖,但帶有沒見過的彩色線條和符號。例如,道路根據(jù)行進方向進行了顏色編碼。綠色和紅色箭頭指示了給定的交叉路口的可能前進方向。工作人員可以點擊屏幕一側的按鈕,拖曳、切換或關閉各種層,控制街景視圖拍攝的交通標志的出現(xiàn)和消失。這些工作人員每天要檢查數(shù)以千計來自谷歌地圖用戶的錯誤報告,并根據(jù)需要進行修復。
工作人員可以手動將地圖道路(左上)對準衛(wèi)星圖像
古普塔還展示了一張顯示道路優(yōu)先級的地圖,線的寬度代表交通流量。谷歌一直用手機的位置信號映射交通條件。不過古普塔承認,位置信號也可以是其他信息的良好來源,比如轉(zhuǎn)彎限制或者單行線。但他拒絕詳細說明,“谷歌在很多地方使用了位置信息,但我不能談論具體的東西。”
除了職業(yè)地圖糾錯團隊,谷歌還得到來自MapMaker計劃的幫助。2011年谷歌推出了普通用戶可以參與的地圖糾錯項目,現(xiàn)在的該項目遍及220個國家。目標是提高谷歌地圖在發(fā)展中國家和其他地區(qū)的準確度。因為在那里無法獲得詳細的地圖源,“我們招募用戶添加對于他們很重要的地圖信息。我們會提供工具和衛(wèi)星圖像,因此他們可以很輕松的進行修正?!?/span>
用戶可以提供公園、步道以及其他街景車無法進入的地方的信息。麥克倫登本人就曾幫助繪制Windy山的登山路徑,“我用GPS記錄了我登山的路徑,完善了更多的精確路線。”
當你在筆記本電腦或手機上使用谷歌地圖時,表面的信息之下隱藏著更多的數(shù)據(jù)。不只是道路的布局,還包括鏈接一個點到另一個點的邏輯信息。信息不只是建筑物的形狀,也許未來谷歌地圖只會不斷的細節(jié)化。最終,呈現(xiàn)出來的可能是讓人震驚的世界3D虛擬圖像。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10