
大數(shù)據(jù)對人文—經(jīng)濟(jì)地理學(xué)研究的促進(jìn)與局限
大數(shù)據(jù)技術(shù)的誕生不僅快速推動著社會的進(jìn)步,而且也將科學(xué)研究不斷引向新的高度。以人類社會經(jīng)濟(jì)活動為主要研究對象的人文—經(jīng)濟(jì)地理學(xué)與當(dāng)前大數(shù)據(jù)建設(shè)和發(fā)展趨勢具有高度一致性,大數(shù)據(jù)的發(fā)展對豐富和完善人文—經(jīng)濟(jì)地理學(xué)勢必起到積極的推動作用,同時(shí)也對人文—經(jīng)濟(jì)地理學(xué)的學(xué)科思維和研究方法提出了新的挑戰(zhàn)。梳理和分析了目前大數(shù)據(jù)在人文—經(jīng)濟(jì)地理學(xué)主要研究領(lǐng)域,包括城市內(nèi)部空間研究、交通與消費(fèi)行為、社會空間與社會網(wǎng)絡(luò)研究中的最近進(jìn)展,以及大數(shù)據(jù)對參與式研究和決策平臺的作用。著重剖析了大數(shù)據(jù)對人文—經(jīng)濟(jì)地理學(xué)數(shù)據(jù)獲取,研究思維與范式,研究內(nèi)容、研究時(shí)空尺度與研究目標(biāo)等方面的促進(jìn)作用與存在問題,特別是由于大數(shù)據(jù)自身發(fā)展的不完善,在數(shù)據(jù)收集特別是數(shù)據(jù)屬性方面還存在很大的局限,缺乏理論基礎(chǔ)將會使得大數(shù)據(jù)與實(shí)際應(yīng)用受到很大限制,同時(shí),數(shù)據(jù)本身也不能替代研究者思維和決策過程。因此,人文—經(jīng)濟(jì)地理學(xué)者應(yīng)該科學(xué)對待大數(shù)據(jù)所帶來的機(jī)遇,彌補(bǔ)和豐富以往發(fā)展中的短板,即完善學(xué)科數(shù)據(jù)建設(shè)、建立大數(shù)據(jù)應(yīng)用較為完善的研究方法體系,促進(jìn)跨域數(shù)據(jù)整合和跨域研究,以及推進(jìn)研究對象和研究目的的轉(zhuǎn)變。
1 引言
數(shù)據(jù)與信息收集是科學(xué)研究和政府以及企業(yè)決策重要環(huán)節(jié)。自IT技術(shù)發(fā)展以來,人們獲取數(shù)據(jù)的技術(shù)一日千里,同時(shí)全球各行各業(yè),各個(gè)領(lǐng)域?qū)τ跀?shù)據(jù)的依賴性也大幅度提高。特別是自20世紀(jì)90年代后,IT領(lǐng)域開展了以大數(shù)據(jù)技術(shù)、云計(jì)算和物聯(lián)網(wǎng)為標(biāo)志的又一次顛覆性的變革,這三項(xiàng)技術(shù)之間相互促進(jìn),其中大數(shù)據(jù)最為直接地與社會經(jīng)濟(jì)活動聯(lián)系在一起。作為以社會經(jīng)濟(jì)活動為主要研究內(nèi)容的人文—經(jīng)濟(jì)地理學(xué),在大數(shù)據(jù)時(shí)代中既面臨深化學(xué)科研究內(nèi)容的機(jī)遇,又須面對調(diào)整傳統(tǒng)研究思維的挑戰(zhàn)。
數(shù)據(jù)是科學(xué)研究工作的重要基礎(chǔ),大數(shù)據(jù)的發(fā)展對科學(xué)研究來說具有不可思議的魅力。20世紀(jì)中葉,以數(shù)學(xué)模型為代表的定量研究方法從紛雜的社會經(jīng)濟(jì)現(xiàn)象中抽取典型性數(shù)據(jù),通過數(shù)學(xué)模型的方式揭示社會經(jīng)濟(jì)活動的某種聯(lián)系,從而使得社會經(jīng)濟(jì)現(xiàn)象的研究方法從傳統(tǒng)描述性(Descriptive)研究進(jìn)入到解釋性(Explanative)研究。人文—經(jīng)濟(jì)地理學(xué)者曾經(jīng)經(jīng)歷過對數(shù)學(xué)模型的沉醉、拋棄和理性回歸(楊振山等,2010),如今大數(shù)據(jù)的快速發(fā)展似乎使得研究者又將面臨相似的局面。不同的是,這次將從研究范式、數(shù)據(jù)收集與特點(diǎn)、研究內(nèi)容和研究目的發(fā)起更多疑問。
鑒于此,本文從國內(nèi)外已有的與人文—經(jīng)濟(jì)地理學(xué)相關(guān)的案例和經(jīng)驗(yàn)出發(fā),結(jié)合其學(xué)科研究思維、范式、特點(diǎn)和任務(wù)對此加以剖析,希望能夠在這一新的技術(shù)變革下引起爭鳴,促進(jìn)人文—經(jīng)濟(jì)地理學(xué)積極面對這一重要轉(zhuǎn)變。
2 大數(shù)據(jù)的發(fā)展及其在人文—經(jīng)濟(jì)地理學(xué)中的應(yīng)用
人文—經(jīng)濟(jì)地理學(xué)和大數(shù)據(jù)有著內(nèi)在的本質(zhì)聯(lián)系。這是因?yàn)?以人類社會經(jīng)濟(jì)活動為主要研究對象和研究內(nèi)容的人文—經(jīng)濟(jì)地理學(xué)與當(dāng)前大數(shù)據(jù)的建設(shè)和發(fā)展趨勢高度一致。另外,人文—經(jīng)濟(jì)地理學(xué)是研究人和社會經(jīng)濟(jì)活動在地球表層或一定空間、時(shí)間范圍內(nèi)的規(guī)律和特征。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)的收集和記錄都更加強(qiáng)調(diào)時(shí)間和空間維度,試圖在時(shí)空軌跡中,無時(shí)無刻、無處不在地記錄所發(fā)生的事件,從而構(gòu)成海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(Velocity)、多樣和多元化的數(shù)據(jù)類型(Variety)和巨大的數(shù)據(jù)價(jià)值(Value)等基本特征(Laney,2001)。從數(shù)據(jù)內(nèi)容來看,當(dāng)前大數(shù)據(jù)多是以人類社會經(jīng)濟(jì)活動為主要內(nèi)容(如社會媒體、出行軌跡等)。在一定程度上,大數(shù)據(jù)技術(shù)用數(shù)據(jù)的方式反映了特定的社會經(jīng)濟(jì)文化現(xiàn)象,揭示了社會經(jīng)濟(jì)文化的復(fù)雜性。因此,大數(shù)據(jù)時(shí)代對于作為從空間角度研究人類社會經(jīng)濟(jì)活動的人文—經(jīng)濟(jì)地理學(xué)來說具有非常重要的意義。目前,大數(shù)據(jù)技術(shù)已經(jīng)在人文—經(jīng)濟(jì)地理學(xué)的下述領(lǐng)域中得到一些初步應(yīng)用。
2.1 城市功能區(qū)、熱點(diǎn)區(qū)和邊界鑒別
城市功能區(qū)、熱點(diǎn)區(qū)和邊界是城市空間結(jié)構(gòu)的核心組成部分。其中城市功能區(qū)是實(shí)現(xiàn)城市功能的載體,城市熱點(diǎn)區(qū)是某種社會經(jīng)濟(jì)活動的空間集聚區(qū)域,二者都是城市空間中重要地區(qū),也是政府管理和市場行為的聚焦區(qū)域。城市增長邊界對于控制城市規(guī)模,合理促進(jìn)城鄉(xiāng)協(xié)調(diào)發(fā)展具有重要意義(Nelson et al,1995)。長期以來,上述問題的研究一般通過對規(guī)劃文本的收集和土地利用分析來獲得,其中土地利用分析重點(diǎn)在于說明城市景觀的變化。在此類研究中,功能區(qū)、熱點(diǎn)區(qū)和增長的邊界具有一定的“被劃定性”。隨著遙感信息的豐富,研究者也在試圖通過衛(wèi)星圖像和燈光遙感技術(shù)來識別城市的邊界(Tan et al,2010;Jiang et al,2012),但距離以社會經(jīng)濟(jì)功能來刻畫城市功能區(qū)和增長邊界還有不小差距。
大數(shù)據(jù)技術(shù)促進(jìn)了從社會經(jīng)濟(jì)活動來揭示城市的邊界和功能區(qū)這一方面的研究。例如近來學(xué)者利用大數(shù)據(jù),通過興趣點(diǎn)(Point of Interest,POI)來獲得人們對某一感興趣地區(qū)的訪問次數(shù),從而對城市的熱點(diǎn)區(qū)和邊界加以甄別(Long et al,2013;秦蕭等,2013)。Long等(2014)利用道路網(wǎng)絡(luò)和POI數(shù)據(jù),對中國城市的城市邊界進(jìn)行了地塊尺度刻畫,綜合考慮了物理設(shè)施和人類活動對應(yīng)的興趣點(diǎn)。重要的是,因?yàn)榇髷?shù)據(jù)的采集可以是任意時(shí)段的,那么理論上對空間利用的分析就可以是動態(tài)的過程,這對傳統(tǒng)分析方法來說無疑是一個(gè)巨大進(jìn)步。
2.2 行為和消費(fèi)研究
豐富的數(shù)據(jù)獲取渠道和大規(guī)模的數(shù)據(jù)量為研究交通出行和消費(fèi)奠定了堅(jiān)實(shí)的基礎(chǔ)。隨著移動互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用和發(fā)展,個(gè)人數(shù)據(jù)的產(chǎn)生、記錄、存貯已經(jīng)成為城市居民日常生活的一部分,特別是智能手機(jī)數(shù)據(jù)、公交智能卡數(shù)據(jù)、簽到數(shù)據(jù)、出租車軌跡數(shù)據(jù)為交通和行為研究提供了豐富的數(shù)據(jù)來源,極大地推進(jìn)了人文—經(jīng)濟(jì)地理學(xué)中行為地理和交通地理學(xué)研究(Bentley et al,2014)。如Jun等(2014)利用交通數(shù)據(jù)了解消費(fèi)者行為;Wang等(2014)通過電話記錄比較城市和鄉(xiāng)村居民經(jīng)濟(jì)行為的差異;Cai等(2014)根據(jù)已經(jīng)掌握的出租車軌跡來建立電動車充電樁方案;龍瀛等(2012)利用公交卡數(shù)據(jù)來分析人們出行的行為規(guī)律。
2.3 社會空間與社會網(wǎng)絡(luò)分析
隨著全社會人文關(guān)懷程度的提高,近年人文—經(jīng)濟(jì)地理學(xué)中的社會地理學(xué)得到很大發(fā)展。情感、文化、性別以及公平和民生等都成為社會地理學(xué)中重要話題。大數(shù)據(jù)在這一方面具有獨(dú)特的優(yōu)勢,它通過社交媒體和社交網(wǎng)站表達(dá)和收集大眾心聲,成為獲取上述話題研究所需數(shù)據(jù)的重要來源(秦蕭等,2013)。一些研究利用大數(shù)據(jù)來揭示城市的社會空間構(gòu)成,如犯罪空間(Graham et al,2014)。在網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的推動下,人們還通過獲取社會行為標(biāo)簽(Tag)來反映人們的社會行為和網(wǎng)絡(luò)群體的關(guān)注(Zhang et al,2011),并在社會網(wǎng)絡(luò)圖中辨識區(qū)域所在節(jié)點(diǎn)的特殊性和作用。如何從認(rèn)知論的角度將標(biāo)簽信息化成為這一類研究的關(guān)鍵和難點(diǎn)。
3 大數(shù)據(jù)研究范式的沖擊與人文—經(jīng)濟(jì)地理學(xué)研究范式的不可替代性
由于大數(shù)據(jù)在研究思維和研究方式等很多方面與傳統(tǒng)研究有較大不同,因此在推動人文—經(jīng)濟(jì)地理學(xué)研究的同時(shí),大數(shù)據(jù)也激發(fā)了人文—經(jīng)濟(jì)地理學(xué)的思考。首當(dāng)其沖是關(guān)于研究范式。人文—經(jīng)濟(jì)地理學(xué)存在人文主義、結(jié)構(gòu)主義和實(shí)證主義等研究范式,從不同角度揭示和解釋社會經(jīng)濟(jì)活動規(guī)律,以及人與自然環(huán)境之間的交互關(guān)系。受20世紀(jì)80年代以來西方新經(jīng)濟(jì)地理學(xué)的“文化轉(zhuǎn)向”和“制度轉(zhuǎn)向”的影響(劉衛(wèi)東等,2004),人文—經(jīng)濟(jì)地理學(xué)開始關(guān)注文化、制度,將其作為社會發(fā)展格局和動力機(jī)制的深層次原因。此后關(guān)系地理(Relation)、演化地理(Evolution)等研究范式也為人文—經(jīng)濟(jì)地理學(xué)者理解空間經(jīng)濟(jì)要素及其相互關(guān)系提供了重要的理論基礎(chǔ)(苗長虹等,2007;賀燦飛等,2014)。在人文—經(jīng)濟(jì)地理學(xué)發(fā)展壯大的過程中,理論指導(dǎo)發(fā)揮著關(guān)鍵性作用。
“讓數(shù)據(jù)說話”(Data Tell the Truth)是大數(shù)據(jù)技術(shù)發(fā)出的最強(qiáng)音。同時(shí),在數(shù)據(jù)處理上,大數(shù)據(jù)技術(shù)具有“要全體不要抽樣、要效率不要絕對精確、要相關(guān)不要因果”3個(gè)顯著性特征(Mayer-Schonberger et al,2013)。在沒有理論和任何假設(shè)的基礎(chǔ)上,大數(shù)據(jù)技術(shù)是由最終數(shù)據(jù)結(jié)果所呈現(xiàn)的具體形態(tài)、格局和問題來反映真實(shí)世界。數(shù)據(jù)所揭示的內(nèi)容就是真實(shí)世界本身,而科學(xué)研究所需要進(jìn)行的只是對數(shù)據(jù)技術(shù)(收集、過濾和表達(dá)等)進(jìn)行完善,對數(shù)據(jù)價(jià)值不斷挖掘,從“事物的相關(guān)性”中去預(yù)測。
上述研究范式無疑對人文—經(jīng)濟(jì)地理學(xué)的科學(xué)研究范式構(gòu)成了重大沖擊?!叭绻阒酪粋€(gè)人過去的所有社會數(shù)據(jù),那么你對他未來行為的預(yù)測的準(zhǔn)確性將達(dá)到93%”(Barabasi,2010)。大數(shù)據(jù)真的只給除數(shù)據(jù)之外的科學(xué)研究留下7%的空間嗎?人文—經(jīng)濟(jì)地理學(xué)的研究是否只要交給數(shù)據(jù)科學(xué)家就可以了呢?大數(shù)據(jù)對人文—經(jīng)濟(jì)地理學(xué)最大的挑戰(zhàn)可能在于“一切讓數(shù)據(jù)說話”的口號。大數(shù)據(jù)研究似乎更加“單刀直入”,希望通過全樣本數(shù)據(jù)來深刻地揭示研究對象,從而對研究內(nèi)容進(jìn)行“無微不至”的深刻揭示。然而,沒有任何理論假設(shè)讓大數(shù)據(jù)的使用在科學(xué)研究中失去“先驗(yàn)性”科學(xué)設(shè)想。一個(gè)個(gè)數(shù)據(jù)結(jié)果,一張張數(shù)據(jù)圖最終還是會和特定的社會發(fā)展現(xiàn)象聯(lián)系起來,然后再回到問題研究的整體脈絡(luò)中進(jìn)行分析,并解釋其原因。大數(shù)據(jù)研究有時(shí)可能僅僅簡單到數(shù)據(jù)分析(Boyd et al,2012)。所以從這一點(diǎn)來說,如果大數(shù)據(jù)分析離開原有人文—經(jīng)濟(jì)地理學(xué)長期積累的學(xué)科知識和理論體系,將無法體現(xiàn)大數(shù)據(jù)巨大的價(jià)值(Value)。
人文—經(jīng)濟(jì)地理學(xué)研究往往是采用的描述、分析、解釋和預(yù)測這些主要研究方式的一種或者幾種。大數(shù)據(jù)在描述上具有無與倫比的優(yōu)勢。但是當(dāng)前我們看到的數(shù)據(jù)結(jié)果卻常常很相似或有雷同,即海量復(fù)雜數(shù)據(jù)最終生產(chǎn)出千篇一律的結(jié)果。理論性的先天不足又使得大數(shù)據(jù)很難在分析和解釋上有所進(jìn)展。另外,依托數(shù)據(jù)進(jìn)行科學(xué)預(yù)測也需要根據(jù)先驗(yàn)知識或者參照某一理論來進(jìn)行。由此看來,數(shù)據(jù)是大數(shù)據(jù)的魅力所在,但過度強(qiáng)調(diào)則可能會使大數(shù)據(jù)自身發(fā)展喪失其巨大價(jià)值(Value)得到挖掘的機(jī)會。人文—經(jīng)濟(jì)地理學(xué)在這方面與大數(shù)據(jù)技術(shù)的發(fā)展是互補(bǔ)性關(guān)系,利用大數(shù)據(jù)海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(Velocity)、多樣和多元化的數(shù)據(jù)類型(Variety),人文—經(jīng)濟(jì)地理學(xué)無論是檢驗(yàn)和深化既有理論體系,還是發(fā)展新的學(xué)科內(nèi)容都具有無限的可能性,同時(shí)也將有助于大數(shù)據(jù)本身巨大價(jià)值的發(fā)揮。
4 大數(shù)據(jù)對人文—經(jīng)濟(jì)地理學(xué)數(shù)據(jù)源的革新與使用局限
人文—經(jīng)濟(jì)地理學(xué)研究,尤其是定量研究常常依賴于官方數(shù)據(jù)。通常,官方數(shù)據(jù)是自上而下的數(shù)據(jù)結(jié)構(gòu),往往不能滿足研究和應(yīng)用的需要,如房地產(chǎn)研究常常需要實(shí)時(shí)房價(jià)信息。因此,人文—經(jīng)濟(jì)地理學(xué)中很多研究問題,特別是周期性、長期性研究受到很大的局限。
在信息化、數(shù)字化、網(wǎng)格化和云計(jì)算等技術(shù)的輔助支撐下,大數(shù)據(jù)充分地利用空間技術(shù)或地學(xué)技術(shù),如遙感和地理信息系統(tǒng)和空間定位技術(shù)等,實(shí)時(shí)對研究興趣點(diǎn)(Point of Interest)進(jìn)行數(shù)據(jù)捕捉。收集的數(shù)據(jù)既不同于一貫采用的以“人”為媒介的調(diào)查方法所獲得的數(shù)據(jù),也不是官方發(fā)布的“硬數(shù)據(jù)”,而是通過“機(jī)器”實(shí)時(shí)收集的人文—經(jīng)濟(jì)地理學(xué)“一手?jǐn)?shù)據(jù)”和“軟數(shù)據(jù)”。因此,大數(shù)據(jù)技術(shù)為人文—經(jīng)濟(jì)地理者提供了另一數(shù)據(jù)收集手段(甄峰等,2014)。在“機(jī)器”的幫助下,數(shù)據(jù)數(shù)量和種類都極大地豐富了。
但是,隨之也會產(chǎn)生一些問題。首先是數(shù)據(jù)的使用“壽命”大大縮短了,如交通流、車輛擁堵情況等都被具體定格化。統(tǒng)計(jì)資料可能需要每個(gè)月、每年(如經(jīng)濟(jì)統(tǒng)計(jì)資料)或幾年(如普查)發(fā)布一次,這些官方資料由于其發(fā)布時(shí)間的穩(wěn)定性、綜合性和共識性,通??梢员豢醋魇侨宋纳鐣?jīng)濟(jì)領(lǐng)域的“硬數(shù)據(jù)”。而通過大數(shù)據(jù)方式采集的數(shù)據(jù)只是時(shí)空的一個(gè)片段,是“硬數(shù)據(jù)”的一個(gè)個(gè)子集或細(xì)化單元。當(dāng)然,如果可以對大數(shù)據(jù)進(jìn)行長期的記錄來分析其規(guī)律性,那么一個(gè)個(gè)子集描述的情況遠(yuǎn)比綜合(Aggregate)、代表性描述準(zhǔn)確得多,信息也豐富得多。但是即便如此,大數(shù)據(jù)中的單個(gè)記錄(Record)遠(yuǎn)沒有傳統(tǒng)的統(tǒng)計(jì)資料中的記錄那么有意義。
其次,盡管大數(shù)據(jù)宣稱是用全樣本在做數(shù)據(jù)分析,但其實(shí)調(diào)查群體存在很大限定性,或者說存在數(shù)據(jù)有偏性。如社交網(wǎng)絡(luò)數(shù)據(jù)是基于對使用社交網(wǎng)絡(luò)人群的調(diào)查,對于不用社交網(wǎng)絡(luò)的人來說,如大多數(shù)老年人、未入學(xué)的少年兒童和因貧困沒有能力購買社交電子產(chǎn)品的人來說,大數(shù)據(jù)技術(shù)顯然在目前是無能為力的。再如獲取公交刷卡記錄的前提是對使用公共交通者的出行規(guī)律進(jìn)行調(diào)查,對于通勤范圍很短,沒必要使用公共交通工具的人來說,大數(shù)據(jù)的使用便存在一定局限性。而針對數(shù)據(jù)有偏性,一些研究已經(jīng)開始積極采取對應(yīng)方法,例如加強(qiáng)對局部群體的行為特征研究,或者是結(jié)合其他數(shù)據(jù)對同一問題進(jìn)行研究,來保證研究結(jié)果的穩(wěn)定性(Long et al,2014)。此外,對人文—經(jīng)濟(jì)地理學(xué)者而言,一個(gè)很大的遺憾是大數(shù)據(jù)只記錄了空間興趣點(diǎn)的空間信息,其他社會和經(jīng)濟(jì)屬性甚少,大大削弱了大數(shù)據(jù)在人文—經(jīng)濟(jì)地理學(xué)中的應(yīng)用潛力。
再次,我們還需要清楚地記得,人文—經(jīng)濟(jì)地理學(xué)包含定量和定性兩種方法。從開始的實(shí)證主義描述到計(jì)量經(jīng)濟(jì)革命,再到20世紀(jì)90年代后期空間經(jīng)濟(jì)的興起,以及社會文化地理的百花齊放,人文經(jīng)濟(jì)地理最終走向了定性和定量研究相結(jié)合的局面,以提高解決復(fù)雜科學(xué)問題的能力,具體方法包括描述、解釋、格局和模式識別、機(jī)理分析與趨勢預(yù)測等。而大數(shù)據(jù)更多的是定量研究,需要定性研究來配合使得研究更加豐富和完善。即使就定量研究而言,提高大數(shù)據(jù)的分析能力,還需要新的理論和分析方法??梢韵胂?目前的統(tǒng)計(jì)分析工具并不完全適應(yīng)全樣本數(shù)據(jù)。為此,一些研究者在探索新的方法,特別是利用數(shù)據(jù)分析方法來促進(jìn)大數(shù)據(jù)在人文—經(jīng)濟(jì)地理學(xué)中的應(yīng)用,如通過對數(shù)據(jù)分布中異常值的揭示來發(fā)現(xiàn)城市的個(gè)性(Jiang,2015)。
最后,大數(shù)據(jù)對科學(xué)研究也帶來了另一個(gè)嚴(yán)肅的問題,即科學(xué)隱私。所有的人完全暴露在各種數(shù)據(jù)采集器之下,自身的行為、特征等完全不受自身意愿掌控,被采集并加以分析,甚至有可能會被公布。另外,在利用大數(shù)據(jù)進(jìn)行決策的時(shí)候,也要注意到數(shù)據(jù)分析是對以往情況的總結(jié),如果作為判斷和預(yù)測人們潛在行為的標(biāo)準(zhǔn),也是有悖倫理道德的。因此,科學(xué)研究在使用大數(shù)據(jù)時(shí)應(yīng)該有度。
5 大數(shù)據(jù)技術(shù)對人文—經(jīng)濟(jì)地理學(xué)研究內(nèi)容和時(shí)空尺度的影響
大數(shù)據(jù)的基本核心研究內(nèi)容就是數(shù)據(jù),包括數(shù)據(jù)獲取、組織管理和分析等等各種技術(shù)。這一點(diǎn)與人文—經(jīng)濟(jì)地理學(xué)所關(guān)注的社會經(jīng)濟(jì)活動既有聯(lián)系,又有所不同。數(shù)據(jù)的發(fā)出者是人,因此大數(shù)據(jù)直接推動了人文—經(jīng)濟(jì)地理學(xué)對人的關(guān)注,如人的社交網(wǎng)絡(luò)、交通行為等。這樣,大數(shù)據(jù)技術(shù)的發(fā)展客觀上推動了人文—經(jīng)濟(jì)地理學(xué)對人的研究轉(zhuǎn)向,使得研究更加關(guān)注人的活動,如游客滿意度分析等(Xiang et al,2015)。但需要注意的是,數(shù)據(jù)本身對于“人”的特征的記錄很少,因此,大數(shù)據(jù)仍然不能完全替代人文—經(jīng)濟(jì)地理學(xué)的數(shù)據(jù)調(diào)查方法來達(dá)到對人的認(rèn)識。
其次,研究數(shù)據(jù)的豐富和精準(zhǔn)化使得人文—經(jīng)濟(jì)地理學(xué)將面臨尺度收縮問題。人文—經(jīng)濟(jì)地理學(xué)關(guān)注既定空間的社會經(jīng)濟(jì)活動。空間在研究過程中經(jīng)過了高度的概括,如城市、區(qū)域或國家尺度等,相應(yīng)地形成了不同的學(xué)科體系。城市研究只關(guān)注城市內(nèi)部空間,區(qū)域研究將城市高度抽象為點(diǎn),而國家或全球尺度研究則將國家或者區(qū)域抽象成點(diǎn)。這樣,人文—經(jīng)濟(jì)地理學(xué)實(shí)際上存在空間尺度和時(shí)間尺度收縮問題(Scaling Issue)。通俗地講,就是存在“只見森林,不見樹木”或是“只見樹木,不見森林”的情況。比如區(qū)域交通流分析往往是城市間或者省區(qū)間被加總的數(shù)據(jù),個(gè)體數(shù)據(jù)(特別是一些異常值或溢出值)被過濾掉了,或是省區(qū)間交通流向的數(shù)據(jù)無法進(jìn)一步細(xì)化到城市與城市間、城市與鄉(xiāng)村間。大數(shù)據(jù)可以從多角度、多維度對一個(gè)具體的研究空間對象進(jìn)行分析,從整體(群體)和個(gè)體兩個(gè)層面對研究對象進(jìn)行深入。在這一情況下,隨著空間尺度的縮放,事物特征逐級展現(xiàn)出來。時(shí)間尺度上,人文—經(jīng)濟(jì)地理學(xué)研究,如交通流量,往往用一段時(shí)間的整體情況來進(jìn)行分析,無法反映出時(shí)間片段,如季節(jié)性、周期性變化等。所以同樣的,時(shí)間尺度的縮放可以幫助研究者更加準(zhǔn)確地理解事物特征。
隨著尺度縮放問題的解決,一些“細(xì)化”的問題得到揭示。這些“細(xì)化”問題可能會具有重要的研究價(jià)值。如社會經(jīng)濟(jì)活動中的旅游活動,往往存在季節(jié)性特征;兩個(gè)城區(qū)間交通總量一致的情況下,也可能存在明顯的城市與城市、城市與鄉(xiāng)村之間的差異,這些都構(gòu)成了人文—經(jīng)濟(jì)地理學(xué)研究地區(qū)分異規(guī)律的重要內(nèi)容。一些溢出值或異常值也可能在某些情況下具有重要的研究意義或者研究價(jià)值,反映了有別于總體特征規(guī)律的特殊情況。隨著大數(shù)據(jù)技術(shù)的推進(jìn),人文—經(jīng)濟(jì)地理學(xué)可能要對時(shí)空尺度縮放所產(chǎn)生的問題進(jìn)行細(xì)致深入的研究。
另外,大數(shù)據(jù)大大推進(jìn)了人文地理學(xué)的跨界研究。與以往的數(shù)據(jù)收集不同,很多數(shù)據(jù)的收集以人為核心,采集了社會和自然的信息,反映了人與自然、人與環(huán)境的相互關(guān)系,如健康、污染暴露等。從這一點(diǎn)來說,大數(shù)據(jù)有望推進(jìn)入文地理學(xué)的跨界研究,更加深入地研究人地關(guān)系/人與自然的關(guān)系(Human-Nature Relationship)(Crain et al,2014)。如Google公司利用網(wǎng)頁訪問的大數(shù)據(jù),比美國疾病中心提前約一周的時(shí)間預(yù)測了傳染病在美國的傳播路徑(Ginsberg et al,2009);有學(xué)者利用大數(shù)據(jù)對環(huán)境變化檢測和人健康影響做出了評價(jià)等(Vitolo et al,2015)。大數(shù)據(jù)的采集可能對新的研究話題,或是過去受到數(shù)據(jù)收集限制的話題做出積極的貢獻(xiàn),如地緣政治的研究。
因此,大數(shù)據(jù)對人文—經(jīng)濟(jì)地理學(xué)的研究內(nèi)容的深化起到了重要的作用。對于“人”的關(guān)注,時(shí)空尺度研究和人文—自然綜合研究等都是人文—經(jīng)濟(jì)地理學(xué)近年來新的重要研究方向。人文—經(jīng)濟(jì)地理學(xué)和大數(shù)據(jù)技術(shù)應(yīng)該在這些方面進(jìn)行更加深入的交叉和互補(bǔ)。
6 科學(xué)問題和實(shí)踐應(yīng)用的相互促進(jìn)
人文—經(jīng)濟(jì)地理學(xué)大數(shù)據(jù)技術(shù)發(fā)展的土壤更多地來源于實(shí)踐需求。一個(gè)重要的事例就是在大數(shù)據(jù)的基礎(chǔ)上,結(jié)合云計(jì)算和物聯(lián)網(wǎng)技術(shù)發(fā)展的智慧城市(Batty,2012)。智慧城市是在高度信息化狀態(tài)下,充分利用大數(shù)據(jù)和各項(xiàng)技術(shù)對未來城市建設(shè)的新嘗試。它試圖從城市尺度(包括社區(qū)、主要功能區(qū)和城市其他尺度),利用現(xiàn)代信息技術(shù),對現(xiàn)代城市發(fā)展模式進(jìn)行改進(jìn),逐漸從目前的經(jīng)濟(jì)領(lǐng)域開始向人們的日常生活和空間布局推進(jìn)(Allwinkle et al,2011)。其內(nèi)容包括民生、環(huán)保、公共安全、城市服務(wù)、工商業(yè)活動等方面(謝耘,2012)。大數(shù)據(jù)將充分運(yùn)用其信息和通信技術(shù)手段感測、分析、整合城市運(yùn)行核心系統(tǒng)的各項(xiàng)關(guān)鍵信息,但如何與人類智慧型發(fā)展所需的各種條件,以及如何與城市政策決策過程有效銜接起來,目前還處于研究的起步階段(Abb et al,2012;Anthopoulos et al,2012)。由于技術(shù)方式、產(chǎn)業(yè)內(nèi)容、地方功能的重要轉(zhuǎn)變,智慧城市和大數(shù)據(jù)應(yīng)用將對城市規(guī)劃產(chǎn)生重要影響。
人文—經(jīng)濟(jì)地理學(xué)同樣與社會實(shí)踐緊密相連,但更多的是對科學(xué)問題的研究??茖W(xué)研究與實(shí)踐可以相互促進(jìn)。例如,人文—經(jīng)濟(jì)地理學(xué)在研究中力求建立一種參與式(Participatory Approach)的研究方法,這一研究方法通常在研究者的主導(dǎo)下,通過訪談的形式來完成。隨著訪談的難易變化,參與者的數(shù)量和參與次數(shù)可能會受到一定的限制,調(diào)查結(jié)果對真實(shí)情況的反映存在局限。另外,在城市規(guī)劃中,規(guī)劃的制定很大程度上依賴于政府官員對城市發(fā)展的定位,以及規(guī)劃者和研究者對城市的認(rèn)識和判斷,規(guī)劃和研究制定缺乏公眾的參與(王廣斌等,2013)。這樣規(guī)劃的結(jié)果往往就是重視空間物質(zhì)形態(tài)表現(xiàn),缺少人文關(guān)懷;重視經(jīng)濟(jì)發(fā)展,缺少人居環(huán)境考慮,規(guī)劃的制定和執(zhí)行與當(dāng)前提倡的以人為本和精細(xì)化管理要求相去甚遠(yuǎn)。大數(shù)據(jù)的興起為參與式研究和規(guī)劃搭建了新的平臺。通過互聯(lián)網(wǎng)公共平臺建設(shè),大數(shù)據(jù)可以輕松地將研究者的研究問卷或問題提交在平臺上,公眾可以對這些問題作出回答甚至是修改。同時(shí),政府工作也將更加透明,一方面受公眾監(jiān)督,需要快捷地對居民需求作出反應(yīng);另一方面利用豐富的社會資源降低管理成本,提高管理效率。香港盡管高樓林立,但仍有70%的面積是綠地,其中有40%是政府保護(hù)性綠地,但在經(jīng)濟(jì)的刺激下,非法侵占綠地情況時(shí)有發(fā)生,給政府監(jiān)管帶來很大的麻煩。公共參與式管理為這一問題提供了解決途徑。2005-2009年,關(guān)于侵占綠地20485起投訴中,有93%來自于公眾,形成了特殊意義上“港人治港”的“市民地圖”。
或許大數(shù)據(jù)和人文—經(jīng)濟(jì)地理學(xué)在針對社會經(jīng)濟(jì)活動中具有不同的分工,二者在實(shí)踐應(yīng)用和科學(xué)問題研究中不可相互替代。大數(shù)據(jù)側(cè)重于數(shù)據(jù)的收集、分析與加工過程,雖然對揭示問題具有一定的幫助,但不能完全替代科學(xué)工作者對科學(xué)問題的認(rèn)知和把握。另外,大數(shù)據(jù)缺少了決策分析這一重要環(huán)節(jié)(Analytis et al,2014),因此在數(shù)據(jù)分析之后,常常需要研究者結(jié)合其他情況進(jìn)行更加綜合的分析和判斷。
7 結(jié)論:以大數(shù)據(jù)來推進(jìn)人文—經(jīng)濟(jì)地理學(xué)發(fā)展
信息技術(shù)正在成為社會發(fā)展和建設(shè)的主要關(guān)鍵性動力,深刻地影響和改變著今后的社會發(fā)展。人文—經(jīng)濟(jì)地理學(xué)及相關(guān)學(xué)者從研究到實(shí)踐都積極參與其中,適應(yīng)并積極響應(yīng)這一新趨勢帶來的機(jī)遇和挑戰(zhàn)。目前大數(shù)據(jù)技術(shù)剛剛嶄露頭角,因此本文探討的許多問題還都沒有最終答案,希望將來會有更多、更深入的思考。另外,鑒于在大數(shù)據(jù)技術(shù)的應(yīng)用和探索中,中國基本處于與國際同步階段,所以也希望中國將來通過研究的深化,在這一方面能夠處于國際人文地理學(xué)界領(lǐng)先地位。
7.1 充分利用新的數(shù)據(jù)源,完善學(xué)科數(shù)據(jù)建設(shè)
數(shù)據(jù)(包括定量和定性數(shù)據(jù))制約著人文—經(jīng)濟(jì)地理學(xué)研究的深度和廣度(宋長青等,2004)。大數(shù)據(jù)為人文—經(jīng)濟(jì)地理學(xué)提供了新的重要數(shù)據(jù)獲取方式,在數(shù)據(jù)的空間和時(shí)間精度上進(jìn)行了很大的推進(jìn),從而使得人文地理學(xué)在廣度(新內(nèi)容)和深度(研究尺度,研究問題的深入)的發(fā)展上成為可能。隨著數(shù)據(jù)類型的豐富和數(shù)據(jù)源的多樣化,特別是長時(shí)間、多尺度、個(gè)體記錄在大數(shù)據(jù)技術(shù)上的初現(xiàn)端倪,數(shù)據(jù)建設(shè)將成為人文—經(jīng)濟(jì)地理學(xué)中一個(gè)重要問題。人文—經(jīng)濟(jì)地理學(xué)者從被動地接受二手?jǐn)?shù)據(jù)變?yōu)橹鲃拥孬@取和持續(xù)記錄自己感興趣的研究數(shù)據(jù),并按照研究內(nèi)容和研究目的設(shè)計(jì)數(shù)據(jù)類別和屬性,獲取數(shù)據(jù)的方式發(fā)生了重大變化。
在數(shù)據(jù)庫的建設(shè)中,數(shù)據(jù)(源)之間的可比性成為比較研究的關(guān)鍵。如Facebook在中國和俄羅斯都不是主流社交媒體工具。受文化、制度和技術(shù)發(fā)展水平的影響,各地大數(shù)據(jù)技術(shù)應(yīng)用等都會有所不同,發(fā)達(dá)與落后國家和地區(qū)會有形成“數(shù)字鴻溝”的潛在風(fēng)險(xiǎn)。
數(shù)據(jù)的重要性,潛在的一個(gè)疑問就是,對于研究者來說是否會存在“數(shù)據(jù)為王”的現(xiàn)象?近期由于受數(shù)據(jù)獲取性的限制,我們認(rèn)為短期內(nèi)會存在這一情況。但長期來看,由于開源數(shù)據(jù)的發(fā)展趨勢,以及大數(shù)據(jù)本身需要與理論和應(yīng)用的結(jié)合,思想的高度最終會決定大數(shù)據(jù)的命運(yùn)和研究者的成敗。在這一方面,韓國政府正在推進(jìn)面向研究和政策制定者,通過物聯(lián)網(wǎng)技術(shù)從環(huán)境中提取大數(shù)據(jù),從而推動以大數(shù)據(jù)為支撐的綠色I(xiàn)T發(fā)展(Baek et al,2015)。
7.2 建立大數(shù)據(jù)應(yīng)用較為完善的研究方法體系
大數(shù)據(jù)可能是除定量和定性之外的第三大類研究方法①(Delyser et al,2003;Gray et al,2007)。一方面,它將定量數(shù)據(jù)的收集發(fā)揮到極致;另一方面對于人的感覺、情感、經(jīng)驗(yàn)、體驗(yàn)、信仰、價(jià)值、思想和創(chuàng)造性也具有極強(qiáng)的數(shù)據(jù)收集和分析能力(如輿情)。大數(shù)據(jù)強(qiáng)調(diào)了數(shù)據(jù)密集型科學(xué)研究(Data-extensive Inquiries)并有效地利用已經(jīng)建立的多種計(jì)算分析工具,從數(shù)據(jù)的角度揭示問題。從數(shù)據(jù)類型的廣度、豐度、深度(時(shí)間和空間尺度)來說,大數(shù)據(jù)有望成為人文—經(jīng)濟(jì)地理學(xué)中第三類研究方法。
當(dāng)然建立這一研究方法并不是一蹴而就的。一是大數(shù)據(jù)本身需要規(guī)范化;二是從適用范圍、分析方法和模型等方面還需建立起一套完整的方法。目前對大數(shù)據(jù)的應(yīng)用需要十分謹(jǐn)慎。由于研究個(gè)體特征等諸多問題,大數(shù)據(jù)分析結(jié)果的代表性尚存在很多問題。在有限條件下,回溯模擬大數(shù)據(jù)分析結(jié)果與其他數(shù)據(jù)源結(jié)果的相關(guān)性,在此基礎(chǔ)上進(jìn)行更大程度的推廣可能是一個(gè)辦法和途徑。如研究者曾利用Google公司頁面訪問查詢,對2003-2008年美國流行病傳播進(jìn)行分析,結(jié)果表明這一指標(biāo)和美國疾病控制中心的檢測結(jié)果間相關(guān)系數(shù)高達(dá)0.97(Ginsberg et al,2009)。
7.3 促進(jìn)跨域數(shù)據(jù)整合和跨域研究
人文—經(jīng)濟(jì)地理學(xué)和大數(shù)據(jù)技術(shù)屬于不同域(Domain),目前很多最新的研究進(jìn)展并不是由人文—經(jīng)濟(jì)地理學(xué)者完成的。技術(shù)創(chuàng)造者會受到應(yīng)用性和研究目標(biāo)的困擾,人文—經(jīng)濟(jì)地理學(xué)者將面對數(shù)據(jù)收集和分析的問題,這就要求人文—經(jīng)濟(jì)地理學(xué)者與大數(shù)據(jù)技術(shù)人員間進(jìn)行通力合作。
另外,人文—經(jīng)濟(jì)地理學(xué)者也可以預(yù)期,未來大數(shù)據(jù)除了記錄人類社會經(jīng)濟(jì)活動外,還將納入以往的自然過程(如氣候變化)數(shù)據(jù)。如何整合這些跨域數(shù)據(jù)(Cross-domain),以及融合社會經(jīng)濟(jì)發(fā)展—自然過程信息處理技術(shù)成為研究人地關(guān)系中新的技術(shù)難點(diǎn)和重點(diǎn)。
7.4 推進(jìn)研究對象和研究目的的轉(zhuǎn)變
人和人類社會經(jīng)濟(jì)活動作用于地表,構(gòu)成社會經(jīng)濟(jì)變化的重要內(nèi)容??陀^上,人文—經(jīng)濟(jì)地理學(xué),特別是中國的人文—經(jīng)濟(jì)地理學(xué)更多地關(guān)注后者。隨著大數(shù)據(jù)技術(shù)對人無時(shí)無刻的記錄和參與式方法平臺的夯實(shí),以及人文關(guān)懷的日益重要,以人為主要研究對象和以提高人的生活質(zhì)量為研究目的將是未來人文地理學(xué)的重要方向。當(dāng)然,這一轉(zhuǎn)變還需大數(shù)據(jù)技術(shù)本身對調(diào)查對象的屬性進(jìn)行更有力、更明確的界定說明,同時(shí)也離不開與傳統(tǒng)調(diào)查法的相互驗(yàn)證。但可以相信,在大數(shù)據(jù)的推動下,人文—經(jīng)濟(jì)地理學(xué)研究的應(yīng)用性也將會有力地推進(jìn)社會管理過程中的公眾參與度、公共權(quán)力的透明度與城市決策過程的公開化。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07