
基于移動定位大數(shù)據(jù)的城市空間研究進展
通過文獻梳理,發(fā)現(xiàn)大數(shù)據(jù)為空間研究提供了豐富的樣本,但當(dāng)前的數(shù)據(jù)存在非全樣本、缺少社會經(jīng)濟屬性、非隨機缺失的缺陷。大數(shù)據(jù)研究的廣度和深度正在不斷擴展,呈現(xiàn)出多學(xué)科參與的特點,但研究結(jié)論還缺少新的理論探索和解決實際問題的應(yīng)用。據(jù)此提出當(dāng)前的大數(shù)據(jù)只是傳統(tǒng)數(shù)據(jù)的有益補充,適用于描述、分析空間現(xiàn)象和規(guī)律,適宜于兩方面研究:驗證理論模型、提出研究問題;分析空間現(xiàn)狀、評估空間規(guī)劃。這兩方面研究可通過統(tǒng)計匯總和空間計算的方法實現(xiàn)。
近年來隨著移動定位服務(wù)和云處理技術(shù)的發(fā)展,搜集和處理個人定位信息已成為現(xiàn)實。由移動定位數(shù)據(jù)組成的海量數(shù)據(jù)(大數(shù)據(jù))庫打破了傳統(tǒng)的資料搜集方式,推動了城市空間研究的發(fā)展。諸多學(xué)者利用當(dāng)前可獲取的移動定位大數(shù)據(jù)(本文中的大數(shù)據(jù)均指移動定位大數(shù)據(jù),包括手機數(shù)據(jù)、公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、社交網(wǎng)站簽到數(shù)據(jù)等)開展了城市空間研究,取得了較豐富的成果。當(dāng)前已有國內(nèi)學(xué)者對這些研究成果做了介紹,如秦蕭等從城市等級體系、交通、功能區(qū)、特征與活動、社交關(guān)系、重大事件等方面介紹了大數(shù)據(jù)在城市空間研究中的最新進展,提出了基于大數(shù)據(jù)的城市空間研究體系[1]。葉宇等從實體空間、社會空間兩方面介紹了大數(shù)據(jù)在城市空間研究中的成果,提出大數(shù)據(jù)時代城市規(guī)劃在數(shù)據(jù)搜集、響應(yīng)速度、編制方式、決策輔助、編制策略、關(guān)注要點、實施過程、評價力度等方面面臨革新[2]。冉斌等提出了手機定位數(shù)據(jù)在不同層面城市規(guī)劃中的應(yīng)用方向,并論述了職住人口空間分布、OD 客流分布、城市間客流聯(lián)系等方面的應(yīng)用實例[3]。任頤等用無錫手機數(shù)據(jù)探索了通勤人口分布、居民出行OD、重點區(qū)域人口集散特征等方面的應(yīng)用[4]。
這些論文重在對已有研究和應(yīng)用成果做較系統(tǒng)的歸納整理,有的還構(gòu)建了基于大數(shù)據(jù)的城市研究框架,對于近年來熱議的“大數(shù)據(jù)時代城市規(guī)劃如何應(yīng)對機遇與挑戰(zhàn)”提供了借鑒。但筆者認(rèn)為城市規(guī)劃作為一門實踐性較強的學(xué)科,在使用數(shù)據(jù)時必須根據(jù)數(shù)據(jù)的特點加以不同方式的利用,方能使數(shù)據(jù)真實反映城市現(xiàn)狀問題,為規(guī)劃設(shè)計提供幫助。因此,還有必要對大數(shù)據(jù)及其研究特征作一個較深入的分析,包括大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比有何優(yōu)勢和缺陷,當(dāng)前大數(shù)據(jù)研究中遇到哪些局限等問題。本文選取了收錄在Web of Science 上的聚焦城市規(guī)劃的對象--空間的文獻進行分析,以期能從這些文獻中解答上述問題,梳理出大數(shù)據(jù)在城市規(guī)劃中適宜的研究。
一、基于大數(shù)據(jù)的城市空間研究類型
艾斯(Ahas)等是較早提出可用手機的移動定位數(shù)據(jù)進行城市空間研究的學(xué)者。2005 年他提出基于手機的社會定位方法(Social Positioning Method)能監(jiān)測人口總量和移動軌跡、預(yù)測和防止由人流集聚產(chǎn)生的問題,這一方法會在不久的將來獲得廣泛應(yīng)用,并從根本上改變公共生活和公共管理[5],但文中并未闡述具體的研究成果。隨后,拉蒂(Ratti)等于2006 年以熱點圖的方式展現(xiàn)了用手機數(shù)據(jù)分析城市活動時空變化的研究成果。提出“隨著新技術(shù)的發(fā)展,人們的生活和工作習(xí)慣正在發(fā)生變化,活動變得更加靈活,城市的動態(tài)性正在變得更加復(fù)雜,需要新的方法和數(shù)據(jù)來分析城市”。拉蒂在文中還提出了“移動景觀”(MobileLandscapes)的概念,來回答如何記錄OD、如何理解個體移動以及城市形態(tài)和流之間是什么關(guān)系,認(rèn)為移動景觀能反映時實移動圖,而不需要再借助傳統(tǒng)模型。并將米蘭20 km×20 km 空間范圍內(nèi)2004 年4 月19 日-5 月4 日的移動通話時長數(shù)據(jù)匯總為人流密度,可視化反映人流活動分別在白天、晚上以及工作日、周末、重大活動日等不同時間段的變化[6]。這一研究開啟了應(yīng)用移動定位數(shù)據(jù)大范圍、大樣本、動態(tài)認(rèn)識城市系統(tǒng)的研究領(lǐng)域:通過數(shù)據(jù)的統(tǒng)計匯總,認(rèn)為城市空間活動雖然由無數(shù)個體的無序活動組成,但在整體層面有規(guī)律可循,可以用移動定位數(shù)據(jù)來反映城市活動的時空變化。
此后便有學(xué)者在拉蒂的研究基礎(chǔ)上,用手機數(shù)據(jù)、公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、社交網(wǎng)站簽到數(shù)據(jù)等移動定位大數(shù)據(jù)探索城市空間研究,并將研究由描述空間的表面現(xiàn)象、識別空間功能深入到驗證傳統(tǒng)理論模型、分析空間聯(lián)系測度中心體系。
(一)空間現(xiàn)象描述
拉蒂的研究對用移動定位大數(shù)據(jù)開展城市空間研究已經(jīng)產(chǎn)生了較大影響,至2015 年1 月已在Web of Science 上有117 次被引,是同類論文中最多的。受拉蒂的影響,諸多學(xué)者開展了類似的研究。例如,維埃拉(Vieira)等用手機通話、短信數(shù)據(jù)表征人流密度變化,發(fā)現(xiàn)中心區(qū)工作日早上密度最高,下午密度下降,晚上商業(yè)、商務(wù)區(qū)和地鐵線周圍密度最高,郊區(qū)周末早上和下午密度最高等現(xiàn)象[7]。塞夫塞克(Sevtsuk)等利用羅馬398 個基站的手機通話時長數(shù)據(jù)研究日?;顒拥囊?guī)律,發(fā)現(xiàn)通話時長可以分為24 小時(即每天的活動是有規(guī)律的)、3.5 天(即工作日和周末的規(guī)律是不同的)、12 小時(表示晝夜的活動規(guī)律)和8 小時(表示工作時間、非工作時間的活動規(guī)律)的周期,大多數(shù)活動都有規(guī)律可循,不同地區(qū)的活動受人口、設(shè)施、環(huán)境等因素影響[8]??巳鹚圭辏↘risp)用赫爾辛基的手機數(shù)據(jù)研究人流密度時實分布情況作為消防和安全設(shè)施布局的依據(jù)[9]。貝克爾(Becker)等利用手機通話和短信數(shù)據(jù)研究莫里斯敦(Morristown)工作、娛樂人群的居住地分布,發(fā)現(xiàn)莫里斯敦對周邊地區(qū)就業(yè)活動的吸引力大于娛樂活動的吸引力,作者還利用通話和短信記錄區(qū)分人群,發(fā)現(xiàn)工作時間比非工作時間使用短信多的人群的空間分布范圍更大[10]。塞戈(Sagl)等用烏迪內(nèi)(Udine)的手機握手?jǐn)?shù)據(jù)、通話時長數(shù)據(jù)和Flicker 社交網(wǎng)站簽到數(shù)據(jù)分析城市不同時段的活動強度。由手機數(shù)據(jù)發(fā)現(xiàn)西部地區(qū)與中心區(qū)的聯(lián)系比東部地區(qū)與中心區(qū)的聯(lián)系強,西北地區(qū)的通信呈現(xiàn)雙峰特征;由社交網(wǎng)站簽到數(shù)據(jù)發(fā)現(xiàn)不同地點的活動特征受季節(jié)影響[11]。隨后又用手機通話、短信數(shù)據(jù),通過可視化分析方法研究烏迪內(nèi)工作日和周末空間活動的時實變化[12]。曼弗雷迪尼(Manfredini)等利用2009 年和2010 年蒙扎(Monza)和布里安扎(Brianza)的手機通話時長、短信、移動交換中心活躍用戶數(shù)據(jù)研究城市動態(tài)活動,提出可以用手機數(shù)據(jù)描述城市空間以小時、天、周為單位的使用強度變化,以此為依據(jù)制定城市政策、計算人口密度、時實監(jiān)測本地和外來人口[13]。約翰(John)等用手機數(shù)據(jù)模擬愛爾蘭區(qū)域性人口流動,結(jié)合馬爾科夫鏈分析人口密度分布,這一研究結(jié)果與中央統(tǒng)計局的人口普查數(shù)據(jù)高度一致[14]。上述研究中使用的手機數(shù)據(jù)有通話時長、通話頻次、短信量、握手?jǐn)?shù)據(jù)等,用來表征城市空間活動強度的統(tǒng)計口徑并不統(tǒng)一。因此,康朝貴等對研究中用通話時長、通話頻次、手機用戶數(shù)能否表示真實的人流活動提出了質(zhì)疑,通過研究3 個數(shù)據(jù)與2008 年全球人口動態(tài)統(tǒng)計分析數(shù)據(jù)(LandScan)的關(guān)系發(fā)現(xiàn),通話時長和通話頻次的關(guān)系隨時間變化,通話頻次與手機用戶數(shù)呈線性相關(guān),手機用戶數(shù)和真實人口數(shù)量的比例在不同地區(qū)是不同的,不能用來表示真實的人口數(shù)量,因此,通話活動能反映活動強度但不能代表人口分布[15]。
空間現(xiàn)象描述利用大數(shù)據(jù)大樣本、高頻率的優(yōu)點,用簡單的統(tǒng)計匯總、可視化表達就能實現(xiàn)傳統(tǒng)調(diào)查方法難以開展的研究。但是,研究結(jié)論只是一般現(xiàn)象的描述,并未深入分析、挖掘現(xiàn)象背后的規(guī)律。
(二)空間功能識別
部分學(xué)者在用大數(shù)據(jù)描述空間現(xiàn)象的基礎(chǔ)上通過空間計算,根據(jù)空間使用特征識別其主導(dǎo)功能,包括識別不同的功能區(qū)、土地使用類型等。例如,瑞茲(Reades)等將羅馬47 km2 劃分為1 600 m2 為單位的柵格,計算每個柵格的平均通話時長并進行標(biāo)準(zhǔn)化處理,并用聚類分析分離出8 類地區(qū),識別羅馬中心城區(qū)邊界[16]。此后又用特征分解法(EigendeComposition)識別和提取羅馬100 萬手機用戶的通話時長數(shù)據(jù),以柵格數(shù)據(jù)反映日間熱點地區(qū),發(fā)現(xiàn)與用企業(yè)黃頁數(shù)據(jù)得到的商業(yè)密度分布非常契合。研究結(jié)果證實了可用手機數(shù)據(jù)來進行空間計算和比較分析[17]。齊觀德(Guande)等利用杭州300 萬條出租車GPS 數(shù)據(jù),分析載客量與城市社會功能區(qū)的關(guān)系。發(fā)現(xiàn)載客量與社會活動強度有關(guān),不同地區(qū)的載客量不同。作者用聚類法識別不同的社會功能區(qū),準(zhǔn)確率達到了97.44%[18]。劉瑜等分析了上海6 600 輛出租車的GPS 數(shù)據(jù)。發(fā)現(xiàn)載客量呈現(xiàn)以24 小時為周期的變化規(guī)律,市中心、居住區(qū)、虹橋機場、浦東機場、郊區(qū)5 個點的載客量具有不同的時間序列。進而利用普利亞姆(Pulliam)提出的“源-庫”(Source-Sink)模型,通過計算上下客人次的差值聚類來分析土地利用現(xiàn)狀,研究結(jié)果與2007 年的土地使用情況一致性高達78.5%[19]。裴韜等通過新加坡的手機通話數(shù)據(jù)的聚類分析表征不同的用地類型,準(zhǔn)確率達到了58.03%,并且發(fā)現(xiàn)用地異質(zhì)性越高準(zhǔn)確率越低,手機基站數(shù)量越多準(zhǔn)確率越高[20]。
空間功能識別解答了用大數(shù)據(jù)描述空間現(xiàn)象是否準(zhǔn)確的疑問。將大數(shù)據(jù)識別的空間功能和普查、統(tǒng)計數(shù)據(jù)進行比較,證明了大數(shù)據(jù)有可能較準(zhǔn)確地反映空間和土地使用,可為開展后續(xù)研究提供支撐。但該類研究本身與城市規(guī)劃關(guān)系并不密切,只是開展后續(xù)規(guī)劃研究的基礎(chǔ)。
(三)理論模型驗證
隨著大數(shù)據(jù)研究的廣泛開展,空間現(xiàn)象描述和空間功能識別已經(jīng)較為成熟,但其局限性也日益顯現(xiàn),即對研究的實際貢獻較小,只是數(shù)據(jù)可視化展示和可信性證明。因此,有研究者開始探索大數(shù)據(jù)在驗證距離衰減效應(yīng)、重力模型等理論模型研究中的作用。例如,拉蒂等將英國12 萬個居民和商戶的固定電話時長數(shù)據(jù)賦值到3 042 個柵格中,分析不同地區(qū)的聯(lián)系程度。在兩次迭代后分離出了23 個地區(qū),與行政邊界高度一致,證明了行政邊界不僅影響人口空間分布,還影響通訊交流[21]??ɡ祭兹–alabrese)等用聚類分析研究手機用戶的動態(tài)OD 矩陣,發(fā)現(xiàn)手機數(shù)據(jù)和普查數(shù)據(jù)在縣級層面(county level)的交通流、工作日早交通、重力模型的標(biāo)準(zhǔn)差的擬合度分別達到了0.73、0.76、0.59,但在普查區(qū)層面(census-tract levels)僅有不到0.3、0.36、0.1。作者認(rèn)為這是由于普查區(qū)層面的樣本量較少、統(tǒng)計時間不一致引起的[22]??党F等通過研究439 萬手機用戶的通話數(shù)據(jù)發(fā)現(xiàn)城市間的通話量不但存在距離衰減效應(yīng),還存在位序分布[23]。高松等做了相似研究,發(fā)現(xiàn)哈爾濱90% 的通話距離在20 km 之內(nèi),通話量的距離衰減參數(shù)(1.45)與空間距離衰減參數(shù)(1.60)相似,反映了網(wǎng)絡(luò)空間的距離限制略小于物理空間[24]。卡拉布雷塞等用馬塞諸塞州的手機數(shù)據(jù)研究出行距離的影響因素,發(fā)現(xiàn)公共交通越便捷,公眾會越傾向于使用公共交通從而增加出行距離[25]。
理論模型驗證是大數(shù)據(jù)理論研究價值的有益探索。大數(shù)據(jù)不再僅是“炫耀”數(shù)據(jù)可視化及分析技術(shù)的工具,開始吸引關(guān)注理論模型研究的專業(yè)學(xué)者。但當(dāng)前的理論研究還只是對傳統(tǒng)理論的驗證,用大數(shù)據(jù)探索新理論尚有較大難度。
(四)中心體系分析
還有學(xué)者通過空間計算對空間現(xiàn)象開展了更為深入的研究,主要致力于定量分析城市中心體系,通過測度人流量及其空間聯(lián)系識別城市中心、分析中心職能。例如,劉亮等用深圳5 000 個出租車GPS 數(shù)據(jù)和500 萬個公交和地鐵IC 卡數(shù)據(jù),建立了一個時實的城市動態(tài)集成圖(Integrated UrbanMobility Patterns)來認(rèn)知城市、優(yōu)化城市動態(tài)分析方法。作者通過研究地鐵站進出人流量發(fā)現(xiàn)世界之窗、崗廈站是居住中心,國貿(mào)、大劇院、華強路、購物公園、車公廟站是工作中心,老街和華強路是購物和娛樂中心。工作日早高峰呈現(xiàn)以世界之窗和崗廈站為中心的由西向東的單向流特征,晚高峰呈現(xiàn)以華強路和大劇院站為中心的由東向西的單向流特征,鐘擺交通量周六大于周日大于工作日。作者又通過分析出租車OD 數(shù)據(jù)發(fā)現(xiàn)羅湖、福田、南山3 個重要的經(jīng)濟發(fā)展區(qū)聯(lián)系最緊密[26]。羅斯(Roth)等提出世界城市有復(fù)雜的空間結(jié)構(gòu),人口、密度、區(qū)位已經(jīng)發(fā)生了巨大變化,不能用簡單的單中心城市結(jié)構(gòu)來解釋。作者將倫敦203 萬人1 122 萬條地鐵刷卡數(shù)據(jù)在空間上以1 500 m 為半徑進行聚類分析,發(fā)現(xiàn)人流向多個中心集聚,證明倫敦是多中心結(jié)構(gòu)的大城市[27]。劉瑜等將上海以人民廣場為圓心的13 km 半徑范圍分為每2 km 為間隔的同心圓,通過每個圈層中出租車上下客人次的差值聚類識別用地功能,發(fā)現(xiàn)由中心至外圍商業(yè)、娛樂用地減少,工業(yè)用地增加,證明了上海呈單中心結(jié)構(gòu)[19]。鐘晨等使用新加坡的公交刷卡數(shù)據(jù)用空間插值(SpatialInterpolation)和匯總統(tǒng)計(Summary Statistics)的方法分析新加坡空間結(jié)構(gòu)的變化。研究發(fā)現(xiàn)隨著公交和地鐵系統(tǒng)的完善,出行距離和客流量都在增長,反映了城市的聯(lián)系強度在加強。因地鐵促進了長距離交通,較高中心度的地區(qū)逐漸增加,有地鐵站點的城市樞紐的功能集聚度增強。增長的公共交通客流量主要集中在副中心所服務(wù)的新建社區(qū),證明新加坡正在向多中心城市結(jié)構(gòu)轉(zhuǎn)變[28]。
中心體系分析不同于空間現(xiàn)象描述,多由專業(yè)學(xué)者以研究問題為目標(biāo),借助空間分析方法,應(yīng)用專業(yè)知識分析數(shù)據(jù)、解讀結(jié)果。這類研究與城市規(guī)劃中的空間結(jié)構(gòu)規(guī)劃有密切關(guān)系,識別城市中心、分析中心職能的方法已經(jīng)能用于評估公共中心規(guī)劃的實施效果,展現(xiàn)出了一定的應(yīng)用前景。
二、大數(shù)據(jù)在城市空間研究中的思考
由上述文獻可知,近年來大數(shù)據(jù)研究的關(guān)注度和成果數(shù)量呈上升趨勢?!冻鞘锌萍茧s志》(Journal of UrbanTechnology)2010 年第1 期開設(shè)了地理和規(guī)劃中的移動定位和追蹤(Mobile Positioning and Tracking in Geography andPlanning)???,2014 年第2 期又一次開設(shè)了移動通信和城市空間(Mobility,Communication,and Urban Space)???。這與當(dāng)前城市空間活動過于復(fù)雜有密切關(guān)系,需要借助大數(shù)據(jù)分析城市中的各種流(Flow)來認(rèn)識由人流、物流、信息流構(gòu)成的網(wǎng)絡(luò)(Network),了解城市要素內(nèi)和要素間的相互作用和關(guān)系,認(rèn)識城市空間的發(fā)展規(guī)律[29] 有密切關(guān)系。但大數(shù)據(jù)在受到熱捧的同時,還需要理性看待,因為大數(shù)據(jù)并非萬能,其研究可能會遇到諸多局限,例如,康朝貴等對通話時長、通話頻次、手機用戶數(shù)能否表示真實的人流活動的質(zhì)疑[15] 值得引起重視?;谏鲜鑫墨I,筆者認(rèn)為當(dāng)前大數(shù)據(jù)及其研究存在以下特征。
(一)大數(shù)據(jù)的優(yōu)勢和缺陷
大數(shù)據(jù)的一大特征就是海量數(shù)據(jù),提供個體時實移動軌跡數(shù)據(jù)。從文獻中可知出租車GPS 數(shù)據(jù)的樣本量和記錄量分別約為103 / 天和105/ 天,公交刷卡數(shù)據(jù)為106/ 天和107/ 天,手機數(shù)據(jù)更是高達107/ 天和108/ 天(不同城市可能會有所差別),遠遠超出了傳統(tǒng)調(diào)查方法能夠獲取的數(shù)據(jù)量。從數(shù)據(jù)內(nèi)容來看,雖然數(shù)據(jù)產(chǎn)生和存儲不是以空間研究為目的(例如,手機數(shù)據(jù)是通信商為了解基站負荷,以便及時增減基站而存儲),但數(shù)據(jù)中包含的“誰-什么時候-在什么地方”的信息與城市空間研究所需的樣本空間數(shù)據(jù)基本一致,為定量分析提供了充足的樣本。
但大數(shù)據(jù)也有缺陷。首先,“大數(shù)據(jù)就是全樣本”[30] 只是在理論上成立,公交刷卡數(shù)據(jù)、GPS 數(shù)據(jù)、手機數(shù)據(jù)等都只記錄了特定人群的時空軌跡(例如,公交刷卡數(shù)據(jù)只記錄了使用公交卡的用戶的數(shù)據(jù)),這種抽樣是非隨機的,是否能準(zhǔn)確代表總體時空軌跡特征存在質(zhì)疑[25]。其次,數(shù)據(jù)內(nèi)容單一,僅有空間信息,不包含樣本的年齡、收入、職業(yè)等社會經(jīng)濟信息[25],只能通過數(shù)據(jù)反映空間的現(xiàn)象和規(guī)律,而難以解釋其背后的社會經(jīng)濟原因。在這種情況下,研究者只能以一般行為規(guī)律為依據(jù),識別行為目的,以試圖挖掘數(shù)據(jù)隱藏的信息。但根據(jù)龍瀛等的研究,從公交刷卡數(shù)據(jù)中能同時識別居住和工作地的用戶僅占總用戶的2.8%[31] ;根據(jù)艾斯的研究,從手機數(shù)據(jù)中能同時識別居住和工作地的用戶僅占總用戶的44.5%[32]。大數(shù)據(jù)一旦進行識別處理,其以全樣本保證抽樣隨機性的優(yōu)勢就不復(fù)存在,識別結(jié)果很有可能會與總體產(chǎn)生偏差,在如此大樣本情況下這種偏差尚缺少科學(xué)方法校準(zhǔn),總量和空間上偏差多少也難以給出確切數(shù)據(jù)。若用識別數(shù)據(jù)進行下一步研究很有可能會產(chǎn)生“精確的錯誤”。最后是數(shù)據(jù)質(zhì)量問題,上文綜述的文獻中雖未提到這一問題,但筆者在研究實踐中[33] 發(fā)現(xiàn)大數(shù)據(jù)并非如邁爾· 舍恩伯格(Mayer-Schonberger)等所說可以“允許不精確”[30]。“允許不精確”需要隨機錯誤這一前提,然而從筆者獲得的數(shù)據(jù)來看,由于數(shù)據(jù)記錄和存儲等問題,數(shù)據(jù)存在非隨機缺失,有的表現(xiàn)為空間缺失,有的表現(xiàn)為記錄缺失。從當(dāng)前的研究成果來看尚缺少驗證數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)應(yīng)用可靠性的方法。
(二)大數(shù)據(jù)研究的局限
從已發(fā)表的文獻來看,大數(shù)據(jù)并未被研究者過度追捧。很多研究者認(rèn)為大數(shù)據(jù)只是提供了過去難以獲取的數(shù)據(jù)源[6,22],上文綜述的文獻中標(biāo)題、摘要或關(guān)鍵詞中出現(xiàn)大數(shù)據(jù)(Bigdata 或Big Data)的僅有1 篇,正文中出現(xiàn)大數(shù)據(jù)的也僅有2 篇。研究依然依托傳統(tǒng)理論開展,將大數(shù)據(jù)作為一種數(shù)據(jù)資料,研究結(jié)論也并無新的理論突破。而從應(yīng)用移動定位大數(shù)據(jù)的時間來看,GPS 數(shù)據(jù)和公交刷卡數(shù)據(jù)都已有10 多年的研究歷史。近年來出現(xiàn)的手機數(shù)據(jù)在數(shù)據(jù)內(nèi)容上與其并無多大區(qū)別,只是數(shù)據(jù)量有了巨大增長。當(dāng)時研究者并未提出大數(shù)據(jù)這個詞,或者說大數(shù)據(jù)尚不能作為學(xué)術(shù)術(shù)語出現(xiàn)在研究成果中。只是近年來由于商業(yè)、政府等非學(xué)術(shù)機構(gòu)的推動,學(xué)術(shù)界才開始逐漸接受這個詞。
從這些文獻的研究內(nèi)容來看,空間現(xiàn)象描述占主導(dǎo),并且仍然是近年來的研究熱點,理論模型驗證、中心體系分析等方面的研究開始涌現(xiàn),研究的廣度和深度正在逐步提升。說明研究者在掌握基本的數(shù)據(jù)處理技術(shù)后,已開始關(guān)注城市空間現(xiàn)象背后的深層次規(guī)律。移動定位大數(shù)據(jù)由于具有較豐富的空間信息吸引了地理學(xué)者、計算機學(xué)者、社會學(xué)者跨學(xué)科研究空間問題。
從研究結(jié)論來看,即使經(jīng)過深入的數(shù)據(jù)分析對理論模型和中心體系有所探討,其結(jié)論也只是對一般規(guī)律的描述,缺少新的理論探索和解決實際問題的應(yīng)用。用大數(shù)據(jù)發(fā)現(xiàn)新現(xiàn)象、找出研究問題[30] 的潛力尚未被充分挖掘。這與部分大數(shù)據(jù)缺少社會經(jīng)濟屬性有關(guān),也與大數(shù)據(jù)需要數(shù)據(jù)處理技術(shù)與規(guī)劃知識的緊密融合有一定關(guān)系,城市規(guī)劃學(xué)者由于缺少數(shù)據(jù)處理技術(shù),在研究中很難真正充分利用數(shù)據(jù),而非規(guī)劃學(xué)者因缺少專業(yè)思想指導(dǎo),又難以提出對規(guī)劃應(yīng)用有實際指導(dǎo)價值的研究問題。
基于上述分析,筆者認(rèn)為大數(shù)據(jù)并不能取代傳統(tǒng)數(shù)據(jù),只是傳統(tǒng)數(shù)據(jù)的有益補充。在研究中應(yīng)充分發(fā)揮兩者各自的優(yōu)勢:大數(shù)據(jù)具有豐富的空間信息,傳統(tǒng)數(shù)據(jù)具有較豐富的社會經(jīng)濟信息??捎么髷?shù)據(jù)來描述、分析空間的現(xiàn)象和規(guī)律,回答“是什么”的問題,再用傳統(tǒng)數(shù)據(jù)來做解釋,回答“為什么”的問題。
三、大數(shù)據(jù)在城市規(guī)劃中適宜的研究方向
基于大數(shù)據(jù)的城市空間研究類型及從文獻中總結(jié)的大數(shù)據(jù)的優(yōu)勢和缺陷、大數(shù)據(jù)研究的局限,筆者認(rèn)為當(dāng)前大數(shù)據(jù)在城市規(guī)劃中適宜于兩方面的研究。一是驗證理論模型和提出研究問題。利用大數(shù)據(jù)豐富的個體移動軌跡信息,從個體出發(fā)以全樣本或大樣本驗證傳統(tǒng)規(guī)劃模型正確與否以及具體參數(shù)的取值,并試圖從中發(fā)現(xiàn)用傳統(tǒng)小數(shù)據(jù)難以發(fā)現(xiàn)的“不符合一般認(rèn)識”的現(xiàn)象和規(guī)律,提出有意義的研究問題,為規(guī)劃研究提供思路。二是分析空間現(xiàn)狀和評估空間規(guī)劃。應(yīng)用大數(shù)據(jù),建立一種自下而上的現(xiàn)狀分析途徑,將大數(shù)據(jù)分析得到的現(xiàn)狀結(jié)論與規(guī)劃藍圖比較,評估現(xiàn)狀或規(guī)劃實施效果,提高規(guī)劃設(shè)計的科學(xué)性、合理性。
基于文獻中的研究方法,筆者認(rèn)為可通過兩種方法實現(xiàn)上述兩方面研究。一是統(tǒng)計匯總。包括:(1)按時間截面匯總每個統(tǒng)計單元的個體數(shù)量,反映特征時間點的人流密度,只要通過簡單的描述統(tǒng)計分析、時間序列分析等方法就能在空間中反映城市的動態(tài)變化過程,結(jié)果往往用熱點圖表示,如拉蒂[6]、塞夫塞克[8]、曼弗雷迪尼[13] 等學(xué)者的研究。(2)按規(guī)律性行為匯總每個統(tǒng)計單元的個體數(shù)量,反映就業(yè)、居住、游憩等活動的空間分布,需要首先依據(jù)一般行為規(guī)律,識別個體行為目的,再用統(tǒng)計學(xué)方法分析不同行為的空間使用特征,如貝克爾[10] 的研究。二是空間計算。即在熱點圖的基礎(chǔ)上運用密度分析、柵格計算、聚類分析等空間計算方法挖掘空間現(xiàn)象背后的規(guī)律,如瑞茲[17]、劉瑜[19]、羅斯[27] 等學(xué)者的研究。
四、結(jié)語
本文通過基于移動定位大數(shù)據(jù)的城市空間研究文獻的梳理,發(fā)現(xiàn)基于大數(shù)據(jù)的城市空間研究的廣度和深度不斷擴展,但是數(shù)據(jù)本身及相關(guān)研究尚存在較多缺陷和局限,需要與傳統(tǒng)數(shù)據(jù)結(jié)合才能發(fā)揮更好的作用,大數(shù)據(jù)在城市規(guī)劃中適宜于驗證理論模型和提出研究問題、分析空間現(xiàn)狀和評估空間規(guī)劃兩方面研究。在信息社會,城市問題更加復(fù)雜,利用大數(shù)據(jù)進行規(guī)劃將會變得越來越普遍。規(guī)劃師亟需轉(zhuǎn)變思路,以多學(xué)科協(xié)作的方式積極參與基于大數(shù)據(jù)的城市空間研究,接受新的思維和方法,應(yīng)對城市問題。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10