大數據時代的中國政治學:機遇挑戰(zhàn)與應對之策
大數據的浪潮正在席卷全球,并深刻地影響和改變中國的社會政治生態(tài)。大數據技術正在重塑政治學的主流研究范式,為政治學的發(fā)展提供全新機遇的同時,也帶來嚴峻的挑戰(zhàn)。在國家治理現代化的中國邏輯中,合適的治理技術既是國家治理體系現代化的關鍵載體,也是切實推動國家治理能力現代化的有效媒介。大數據技術能夠優(yōu)化國家治理的生態(tài)環(huán)境,拓展治理體制機制的彈性空間,是誘發(fā)制度創(chuàng)新與治理轉型的重要源泉。數據分析師通過對大數據海量數據的關聯(lián)性分析,可以更為科學地研判和預測人類政治生活的運動軌跡和發(fā)展趨向,為理解人類政治行為和政治現象提供全新的技術支撐,是提升中國政治學研究科學化、規(guī)范化水平的重要契機。中國的政治學者應該熱情擁抱大數據時代的到來,未雨綢繆,積極尋求應對之策,有力推進國家治理現代化實踐與政治學學術發(fā)展之間的良性互動。
一、大數據技術開創(chuàng)政治學研究的新時代
人類社會已正式進入大數據時代。大數據(BigData)是在物聯(lián)網與
云計算之后發(fā)展出來的全新的技術革命。作為研究數據科學的技術權威和最早洞見大數據時代發(fā)展趨勢的舍恩伯格教授認為,大數據是人類獲得新認知和創(chuàng)造新價值的源泉,也是改變市場、組織機構,以及政府與公民關系的方法[1]。在現代信息社會中,人類生產的數據不僅在規(guī)模上呈指數級增長,更為重要的是數據種類繁多,既有結構化信息,又有文本、圖片、視頻、音頻、郵件、交易信息、社交網絡信息等非結構化信息,而且要求數據分析師快速地采集和處理各種數據[2]。數據來源多元,數據的復雜性大幅提升,數據之間的交互性和關聯(lián)性強,通過數據的整合、分析和開放而實現的數據開發(fā)價值隨之也越來越大。同時,大數據蘊含了豐富的時空信息,數據更新、存儲、傳輸速度快,實時性強,大數據技術善于管理和分析動態(tài)變化的數據流。隨著現代信息技術的發(fā)展,人類開始擁有前所未有的能力來使用和處理海量的數據,
數據分析師在海量數據中發(fā)現新知識和創(chuàng)造新價值,從而為社會帶來“大知識”“大科技”“大利潤”和“大智能”等發(fā)展機遇[3]。而{
數據分析師培訓}大數據技術是一種從各種各樣類型的巨量數據中,快速獲得有價值信息,并將其應用到相關領域的技術,通常與數據分析與挖掘、
數據倉庫、
文本挖掘、關聯(lián)數據、
云計算、物聯(lián)網等技術聯(lián)系在一起,采集數據的工具、平臺和數據分析系統(tǒng)是大數據技術的核心構成要件。大數據時代的到來對自然科學和人文社會科學,包括政治學的研究帶來了極其深遠的影響。
?。ㄒ唬┐髷祿夹g塑造人類政治生活新景觀,拓展政治學研究空間
大數據日益成為影響現實政治的關鍵因素和不容忽視的重要力量。2010年底的“阿拉伯之春”就是源于網絡社交平臺。以臉書(Facebook)、推特(Twitter)等為代表的新媒體在這場社會運動的醞釀、組織、爆發(fā)、升級等各個環(huán)節(jié)均發(fā)揮了關鍵性作用,扮演著信息傳播、動員組織、全球呼應等重要角色。大數據作為“顛覆性創(chuàng)新”,深刻地改變了國家權力與公民權利的關系,帶來了“數據的民主化”,有助于建設更具高效性、創(chuàng)新性和透明性的現代國家治理體系。目前,國際學術界積極將大數據應用于全球治理、國家治理、社會治理、公共服務和政治穩(wěn)定等領域的學術研究工作。大數據作為人類的儀表盤,成為一個幫助人們有效治理貧困、犯罪和環(huán)境污染等問題的智能工具。如聯(lián)合國于2009年發(fā)起的全球脈動計劃,通過對網絡空間海量數據的挖掘和
統(tǒng)計分析,預測各國的失業(yè)率、疾病暴發(fā)、政治動亂等現象,以此作為國際組織有效行動的重要依據。國家安全部門可以通過大數據技術來定位恐怖分子的蹤跡,甚至可以了解多少人和哪些人的政治情緒正在由溫和變得激進,并“算出”誰可能會采取對社會公共利益有害的行動,通過有效監(jiān)控社會情緒提升社會治理水平[4]。
通過電腦對互聯(lián)網上的海量博客文章、政治演講、新聞報道加以
統(tǒng)計分析,從而展開趨勢研判,大數據技術能夠幫助人們更好地理解人類政治行為,給國家和社會治理帶來革命性變化,大數據技術正在觸及人類政治生活的大量核心領域。大數據在提高政策描述和強化政策預測能力方面具有強大潛力。借助大數據技術,尤其是個體、群體、城市以及國家層面的大規(guī)模時間序列數據的實時獲取,研究者對公共政策的描述和評估在時間和空間上變得更為豐富,在數量更多、質量更好的數據基礎上,公共政策的成本-收益分析將更具適用性和科學性。大數據時代塑造了新的人類政治景觀,將政治活動場域從現實空間擴展到虛擬空間,不斷重構著國家和社會的關系,影響著政府、政黨、社會組織、公民等政治行為主體的互動關系模式。大數據技術為以往“不可研究”或“難以研究”的問題提供了輔助性的技術分析手段,促使政治學研究與計算科學、網絡科學的結合,極大地拓展政治學問題的研究空間。
?。ǘ┐髷祿夹g更新政治學的研究方法,形成政治學研究新的主流范式
政治學作為一門獨立的學科,主要基于其自身所具有的一套獨立的方法和理論。方法是獲取知識的重要手段,研究方法的創(chuàng)新是推動理論創(chuàng)新和學科發(fā)展的關鍵途徑。大數據一出現即挑戰(zhàn)著傳統(tǒng)的社會科學研究方法論,悄然引發(fā)政治學、經濟學等學科全方位的方法論變革?!蹲匀弧贰犊茖W》等雜志分別組織??懻摯髷祿ι鐣茖W研究范式的挑戰(zhàn)和價值。大數據時代的政治學研究將不再需要模型和假設,而是利用超級計算直接分析海量數據,發(fā)現相關關系,從而獲得新知識,形成數據密集型科學研究的“第四范式”。有學者認為,隨著計算社會科學(ComputationalSocialScience)的興起,人們將在前所未有的深度和廣度上采集和利用數據為社會科學研究服務[5]。大數據帶來的社會科學范式的轉換,集中體現為大數據帶來了更便捷的數據收集技術,社會科學與計算科學、網絡科學相結合,正在向“計算社會科學”和“網絡社會科學”(E-SocialScience)的方向轉變[6]。大數據政治學至少在方法創(chuàng)新和學科發(fā)展兩大領域的五個方面具有獨特價值:更便捷、更廉價、更大規(guī)模的數據采集;數據分析學新方法的引入;定量與定性方法的整合;政治學與計算科學、信息科學等跨學科研究;數據民主化所推進的政治知識平民化的傳播和普及[7]。隨著政治大數據的快速增長,未來的一切政治現象、政治過程和政治問題,都可以通過更加精確而科學的定量方法予以分析解決。大數據技術為我們的生活創(chuàng)造了前所未有的可量化的維度,過去不可計量、難以存儲、不易分析和不方便共享的很多東西被數據化,通過數據采集、數據儲存、數據分析和數據管理,大數據為大范圍、中時段、長時段的定量分析提供了現實可能[8]。
另外,抽樣誤差曾經是長期困擾社會科學研究的重要難題,而全樣本作為大數據最重要的
特征,甚至可以將抽樣誤差降至為零。在大數據推動政治學研究范式轉換的過程中,技術進步、學科間融合、新數據分析技術的應用、新的國家、商業(yè)和社會組織環(huán)境都會加速這種范式轉換。具體體現為:在研究視角上,實現不同學科間研究方法、理論及測量的整合;在研究方法上,不再需要構建精巧的研究設計來模擬現實,而是可以直接獲取人類行為和互動的基本信息,會逐漸模糊田野研究和實驗研究之間的界線;在樣本選擇上,大數據可以突破傳統(tǒng)抽樣調查的樣本限制,大幅度提高數據的采集頻率[7]。大數據技術不僅為深入探析選舉政治、公民政治心理與行為、政治發(fā)展等傳統(tǒng)政治現象提供了有效的工具箱,更為挖掘信息時代的互聯(lián)網政治、新社會運動、移民政治、認同政治等新興政治現象更新了方法和理論視角,形成以定量研究為主的政治學研究新范式。
(三)大數據技術為政治學大規(guī)模的跨學科協(xié)作研究提供了新的可能性
大數據技術構建了完善而豐富的數據集和分析工具,各種數據的可用性、共享性和協(xié)作性大大增強,為政治學與其他學科的學者之間的大規(guī)模協(xié)作提供了新的可能。新時期的政治學研究需要匯集專業(yè)領域、數據管理、數據分析和項目協(xié)作四大技能,亟需學科跨度較大的專業(yè)學者共同協(xié)作。大數據技術能夠便捷地將政治學研究與自然科學、技術科學緊密結合起來,有效運用自然和技術科學的最新成果及研究手段,推動跨學科的交叉、滲透和融合,使之成為了解人類政治生活客觀實際的必要手段和可行途徑。正是大數據的巨量檔案資料和空前豐富的內容,推動了政治學、社會學、經濟學、思想文化史和生活史研究的重大突破和交叉融合,為公民政治心理和行為傾向、政治期望和利益訴求的研究提供了堅實的實證研究基礎。目前,政治大數據源自呼叫詳細記錄、智能設備和傳感器信息、GPS地理定位映射的數據,以及各種圖像文件、Web文本和點擊流數據、評價數據、電子郵件等構成的政治信息,是根植于一個復雜社會系統(tǒng)環(huán)境中的數據基石。政治學研究者需要密切關注政治大數據的關聯(lián)性分析,精準聚焦政治現象與經濟、文化、社會、教育、生態(tài)領域之間的交互關系,以此為基礎精準分析我們身處的社會未來會出現什么樣的政治現象和政治發(fā)展趨勢,會發(fā)生什么樣的政治事件以及如何去應對和處理變革時代的治理危機和治理風險等。毋庸置疑,政治數據的大規(guī)模產生使得政治學的跨學科研究顯得愈加重要。
政治學已經日益成為一個數據密集型學科。隨著移動互聯(lián)網和物聯(lián)網的發(fā)展,帶來了諸如微博、社交網站、GPS定位、傳感器等多種政治性數據的來源,以文檔和表格形式保存的傳統(tǒng)政治數據被70%至85%的數據是以圖片、音頻、視頻網絡日志、定位信息、鏈接信息等非結構化和半結構化的政治大數據所替代。非結構化數據增多,信息質量參差不齊,對數據的收集、處理和綜合運用更加依賴計算機的輔助。通過大數據技術的成功運用,從多樣性和關聯(lián)性分析中挖掘數據背后的有益信息,提升對社會經濟發(fā)展的預測能力,將改變人民的日常生活、企業(yè)決策和國家治理的面貌,增強政治學研究對于國家和社會治理現代化實踐的指導作用。大數據時代涌現新的政治現象,塑造新的政治關系,人類將在前所未有的深度和廣度上采集和利用數據為政治學的學術研究服務,大數據技術對現實的政治發(fā)展和政治學的學科發(fā)展必將產生深遠影響,開創(chuàng)政治學研究的新時代。
二、大數據時代中國政治學發(fā)展的全新機遇
大數據方法的出現和運用在一定程度上可以穿透政治現象的復雜性和特殊性,提升人類對政治發(fā)展客觀規(guī)律的認知力和洞察力,為中國政治學的研究者提供深刻而豐富的洞見,并為其理論創(chuàng)新奠定堅實的數據和資料支撐。有學者認為,大數據時代的技術具有政治屬性,能夠變革國家與社會關系,重塑公民參與模式,對政黨與選舉、社會運動、地方民主、公共機構和全球治理都產生重大影響[9]。在中國國家治理現代化的歷史和現實邏輯中,科學技術能夠提高經濟發(fā)展水平,從而增強政治合法性。互聯(lián)網對國家和社會同時進行了賦權,兩者都能從其發(fā)展中受益?,F代信息技術的發(fā)展產生了分權的效果,為國家和社會創(chuàng)造了一個新的基礎結構,最終重塑了國家和社會[10]。大數據改變了傳統(tǒng)的政治關系,拓展國家與社會之間的互動范圍;公民參與渠道多元化,彌散的數據資源廣泛分布在政府、市場和社會組織中,對現實的政治發(fā)展過程和中國政治學的學術研究均產生了重大影響。大數據時代中國政治學發(fā)展的全新機遇主要體現在以下三個方面。
?。ㄒ唬┐髷祿r代為中國政治學的學科發(fā)展提供良好契機
經過30多年的發(fā)展,中國政治學的研究對象和研究內容漸趨明確,政治學特有的問題意識、概念和理論體系初步形成,與社會學、經濟學、心理學、人類學、傳播學、信息科學等諸多學科的結合日趨緊密,交叉融合程度加深。然而,由于基礎性數據資料的搜集、整理和分析技術有限,中國政治學長期關注定性研究和規(guī)范研究,研究范圍有限,研究內容陳舊,理論體系單薄,學術研究的專業(yè)化和科學化水平不高。在大數據時代,社交媒體的相繼問世拉開互聯(lián)網嶄新時代——Web2.0,互聯(lián)網開始成為人們實時互動、在線交流的基本載體。隨著信息技術的發(fā)展,對于非結構化數據的處理、挖掘和
統(tǒng)計分析能力得以大幅度提升,過去不可計量、難以存儲、不易分析和不便共享的許多資料被數據化,為政治學吸收和借鑒其他學科的研究方法、研究成果提供更為寬廣的渠道。如在中國政治學的研究中,政治學與傳播學相結合的政治網絡營銷,除了利用互聯(lián)網新媒體進行政治宣傳之外,主要是如何更好地處理網絡輿情,即通過網絡平臺獲取輿情、分析輿情、掌握輿情和影響輿情[11]。在大數據時代,網絡成為政治生活的重要場域,直接改造著政府與公民間的互動模式,并給中國的輿情治理帶來了嚴重挑戰(zhàn)?;ヂ?lián)網和自媒體的信息更新速度快,信息量實現了質的增長,且交互性極強,突破了地域、空間、身份的限制,社會各階層的觀點、情緒和訴求在網絡空間中迅速集聚、碰撞、流傳,信息呈網狀傳播,容易誘發(fā)重大輿情危機,對國家治理和社會穩(wěn)定構成嚴峻挑戰(zhàn)。網絡政治、政治傳播、輿情治理成為中國政治學研究的新領域。
同時,大數據強化了數據之間的相關關系,數據之間的關聯(lián)性分析能夠更好地捕捉現在和預測未來。對現實政治問題的理解不需要建立在假設的基礎上,專注于政治現象的產生機制和內在機理,而是通過海量數據直接構建理論分析模型,科學預測政治事件可能的未來走向。近年來,通過網絡引發(fā)的群體性事件層出不窮,對政府治理和社會穩(wěn)定造成負面消極影響。大數據技術可以通過對網頁瀏覽、論壇留言、微博轉發(fā)等網絡輿情的深度分析,有效預測如恐怖主義和騷亂活動等突發(fā)事件,在應對突發(fā)性安全事件之時,有效降低各種危機帶來的災難和損失[7]。針對大數據對國家和社會治理的強力塑造,中國政治學除了對國家與社會關系、中央與地方關系、執(zhí)政黨建設、現代國家制度建設、政府職能轉變和機構改革、治理體制改革和治理機制創(chuàng)新等問題的研究外,更應該強調對政治數據的采集、儲存、分析和管理,以及對大范圍、中時段、長時段的政治現象和政治事件的定量分析,強化政治大數據之間的關聯(lián)性分析,實時把握政治關系的動態(tài)變遷和政治主體的行為模式與行動邏輯,提升政治學研究的科學預測能力,以堅實的學理基礎為國家智庫建設貢獻學科智慧。
?。ǘ┐髷祿r代助力和推動中國政治學研究方法的創(chuàng)新與變革
“還原論”作為過去幾個世紀一直主宰政治學研究的主流范式,視個體為人類政治現象和政治事務的唯一研究單元。事實證明,對個體的研究越多,并不能相應增進對整個社會和政治系統(tǒng)的科學理解,甚至可能離社會真實與系統(tǒng)真諦相去甚遠。在研究方法創(chuàng)新方面,大數據技術對政治學研究的核心貢獻主要體現在:
第一,大數據時代最大的轉變就是放棄對因果關系的渴求,轉而關注各種相關關系,引導人們只需要知道“是什么”,而不需要知道“為什么”。這將顛覆千百年來人類的思維習慣,對人類認知模式和與世界交流的方式提出全新挑戰(zhàn)。第二,大數據方法革新了政治學研究中數據獲取與管理的既有模式。在傳統(tǒng)的政治學研究范式中,個案研究、抽樣法、問卷法、實驗法等研究方法在中國政治學研究中扮演重要角色,這些方法對于發(fā)現政治現象、理解政治行為和政治心理具有重要意義。然而,隨著信息技術的發(fā)展,研究者從海量的數據中獲取人類政治行為和互動的基本信息,關注事物之間的相關性,不再需要通過研究設計來模擬現實,田野研究和樣本分析下降為輔助工具。在樣本選擇上,政治大數據可以突破傳統(tǒng)抽樣調查的樣本限制,直接對總體的全部數據進行分析處理,獲取研究對象的具體信息。同時,隨著
數據挖掘技術的發(fā)展,歷史文本、社交媒體、多媒體等結構化、非結構化的數據都成為政治學研究的對象。另外,研究者過去所注重的控制變量選擇變得更為多元,實驗設計可以設定更多條件,能夠在很大程度上解決政治學研究普遍性、可控性和現實性三者之間難以同時實現的困境。第三,
機器學習、
數據挖掘等數據分析學(DataAnalytics)的發(fā)展空前催化了政治學研究方法的創(chuàng)新,諸如自動文本分析、主題模型、情感分析等前沿方法被及時應用于政治學研究[7]。第四,大數據技術強化了定量方法與定性方法的對話。大數據方法可以有效利用定量技術分析大規(guī)模的定性資料,同時運用定性方法來呈現和闡釋定量分析結果,實現兩種方法的整合。大數據將量化研究廣泛引入各種政治問題研究之中,使研究對象更加精確化,從而揭示規(guī)律,理清關系,預測事物發(fā)展趨勢。
?。ㄈ┐髷祿夹g將極大地擴展中國政治學研究的內容
在大數據時代,從研究空間上看,中國政治學將從政治實體研究走向虛擬空間研究。傳統(tǒng)上對國家、政黨、政府、社會組織等的研究,主要關注制度建設、國家治理的體制機制創(chuàng)新。隨著大數據時代的到來,政治網絡營銷、政治傳播、輿情治理和社會監(jiān)管等研究領域得到發(fā)展。在門戶網站、網絡論壇、社交平臺等公共空間充斥著大量文本、視頻等結構化和非結構化信息,政治大數據的分析能夠提升政治學者對社會輿論的動態(tài)把握能力,預先防范和紓解新媒體誘發(fā)的各種社會運動和突發(fā)性事件。同時,大數據對政府的治理理念、治理范式、治理內容和治理手段產生不同程度的影響,推動“智能政府”建設[12]。
在政治傳播研究方面,有學者通過追蹤《廣州日報》和《南方周末》從2002年12月至2003年6月間的全部報道來分析政府干預對于“非典事件”曝光的影響,發(fā)現影響“非典”曝光率的三種主要機制是:宣傳部門委任報刊主編;在各個層級發(fā)布指令和通告;傳播領導人在特定場合的直接指示[13]。在網絡政治研究方面,有學者通過對2198個博客從2010年8月30日至11月7日的發(fā)帖內容進行文本分析,發(fā)現在涉及腐敗、環(huán)保、領土爭端等由主流媒體發(fā)起的議題時,政府對于參與者的評論、批評和正式行動會表現得較為寬容,網絡參與起到了—種“安全閥”效應;而當議題超前或涉及敏感領域,如城鄉(xiāng)差異、宗教問題時,過多討論則會加劇社會緊張和不安,發(fā)帖者也更可能遭到嚴格的審查[14]。另有學者首創(chuàng)性地使用自動文本分析技術,對2011年上半年1400多個網站的上百萬個帖子進行內容分析,并將其歸入不同的議題領域。相比于其他議題,中國政府的審查機構對批評政府、領導人和政策的帖子的刪帖率較低;而無論內容為何,有可能導致集體行動或強化社會動員的帖子成為政府審查的主要對象,防止?jié)撛诘募w行動是政府審查的主要動機[15]。大數據是一個以數據為戰(zhàn)略資產的時代,掌握了數據意味著擁有影響力,彌散的數據資源分布在社會、市場中,每個個體都可以發(fā)聲,使社會朝著更加個性化、民主化、開放化方向發(fā)展,對社會組織、企業(yè)和公民行為的研究成為政治學研究的新領域,大數據技術為微觀政治行為的研究開辟新方向。
大數據方法在中國政治學中具有廣闊的應用前景和開發(fā)潛力。中國學者已經啟動利用大數據方法開展國家治理、政府質量、社會治理、政治傳播和互聯(lián)網政治的研究,并取得了初步成果。如有學者通過對網絡問政平臺中公民與政府行為記錄的大數據分析,考察網絡空間的公民訴求表達與政府回應性。發(fā)現時空因素、議題歸屬和訴求表達方式是影響政府回應性的主要變量,分別反映著網絡空間政治互動三要素(制度、政府和公民)的演進和互動策略[16]。更有學者立足于自然科學、人文社會科學的交叉融合和集成創(chuàng)新,廣泛運用世界銀行、聯(lián)合國組織、世界經濟論壇、經合組織等權威機構的大數據,綜合運用背景分析法、
數據挖掘法、
神經網絡算法、社會計算等方法,展開對“國家健康”問題的研究[17]。事實上,每一場技術變革的盛宴都會推動政治學學科的發(fā)展,對政治學的研究方法、研究內容產生重大影響。在大數據時代,通過對政治大數據的收集、處理、存儲和整合,不僅為深入分析政治行為、社會運動等傳統(tǒng)政治現象提供新工具,也為互聯(lián)網政治、政治傳播、輿情治理等新興領域創(chuàng)造新的分析方法和構建新的理論,有利于推進中國國家和社會治理的現代化進程。
三、大數據時代中國政治學研究面臨的主要挑戰(zhàn)
將現有大數據方法應用于政治學等社會科學的研究也面臨若干重要挑戰(zhàn)。大數據時代對數據的收集、存儲和分析的能力要求非常高,對政治學者的知識結構、分析技術和數據處理能力提出了極高的要求,中國政治學傳統(tǒng)的數據處理技術、研究方法和理論建構均難以適應于政治大數據的分析。大數據時代中國政治學研究面臨的主要挑戰(zhàn)具體體現在:
?。ㄒ唬┐髷祿夹g容易導致數據崇拜,中國政治學研究可能面臨定性研究與定量研究、數據分析和理論建構兩張皮的困境
大數據將量化研究廣泛引入各種政治問題的研究之中,但也容易導致數據崇拜,只注重通過政治大數據分析事物之間的相關性,缺乏對基礎理論和因果關系的挖掘。事實上,任何量化的東西,都有其適用性的邊界,數據僅僅是構建理論的工具和手段,政治學學術研究的最終目的還在于通過把握人類政治生活的運動規(guī)律以構建科學的概念與理論體系。同時,目前各種政治學數據庫所選取的數據,不僅存在數據信息本身的局限,還有數據庫建立者自身人為設定的
數據挖掘標準和分析技術與支撐學術研究的信息資料應該具備的普遍性、客觀性與中立性之間的矛盾。在政治大數據庫的使用過程中,選擇多少樣本,選擇什么類型的樣本,亦關涉研究者的主觀性。在中國政治學的發(fā)展過程中,不能將量化研究的意義無限夸大,定量研究須與定性研究相結合,才更有可能提升研究成果的科學含量。
另外,數據崇拜容易導致研究者在數據海洋中迷失自我,熱衷于對技術的掌握,而忽視對理論和現實問題的分析把握,為“數據”而“數據”。大數據關注相關關系和關聯(lián)性分析,可以在不需要了解某些政治現象內部運作機制之時,就可以通過各種海量的政治數據來描繪和測量政治現象之間的互動關系,在探求“是什么”而不是“為什么”的基礎上更好地了解政治現狀和預測未來發(fā)展趨勢,甚至認定相關關系優(yōu)于因果關系。然而,通過探求因果關系、實現因果推論、利用我們已知的知識來了解我們未知的世界,以發(fā)現人類政治生活的內在機理是政治學研究的最終目標。大數據強調相關性而非因果性的研究取向限制了其探究因果關系的能力,缺乏發(fā)現因果關系的優(yōu)勢,應該將大數據分析與實驗設計、參與觀察相結合來獲取有價值的知識,實現數據分析與理論建構的良性互動。
(二)目前的中國政治學者嚴重缺乏大數據意識,也缺乏大數據分析的技術和人才
我國的數據資源雖然豐富,但由于長期缺乏數據文化,收集數據、分析數據和使用數據的意識淡薄。目前,中國擁有的互聯(lián)網用戶和手機用戶都是世界上最多的,而互聯(lián)網和手機都是產生數據的重要來源。因此,中國政治學研究缺乏的不是可供收集的數據,也不是收集數據的手段,而是收集數據的意識。我國的政治大數據不系統(tǒng)、更不具有連續(xù)性,很多數據都沒有長期的積累,妨礙了研究者對歷時性長時段政治變遷問題的研究,難以從歷史的對比中找尋規(guī)律。長期以來,政治學研究者強烈依賴經驗和直覺,用數據描述事實、構建理論的意識不強,大概重于精確、因果關系重于相關關系、預防重于預測成為研究者的思維慣習。事實上,
數據倉庫、
數據挖掘的開展是一個多專家合作的過程,要求相關人員既熟悉本單位業(yè)務和需求,具備相關專業(yè)知識和經驗,同時又了解大數據技術[18]。
此外,應用大數據方法不僅需要強大的數據采集和存儲技術,而且需要開發(fā)數據分析學、預測分析學等數據分析和計算技術,熟練掌握和應用這些技術對于政治學研究者而言是不容小覷的挑戰(zhàn)。而我國的政治學學科內部嚴重缺乏大數據專業(yè)技術人才,研究人員中真正能夠運用政治大數據技術的可謂少之又少。在中國政治學的研究中,由于研究者數據獲取、
數據挖掘、數據整合、數據使用技術的缺乏,大數據的價值未能得到充分體現,阻礙了政治大數據的開發(fā)和利用。強化政治學與計算科學、信息科學的跨學科合作,培育政治學領域的大數據分析人才是當務之急。
?。ㄈ┗跀祿踩?,導致數據開放性、透明性不足,影響數據信度與效度,不利于政治學者對中國政治現象的準確把握
在大數據時代,數據安全問題是國家治理的重大難題,數據庫的泄露將給政府、市場、社會以及公民造成巨大的損害,如2014年爆發(fā)的“棱鏡門”事件就是例證。商業(yè)機構和公共機構掌握的大數據既涉及到個人隱私,也涉及到利益分配等問題,數據向研究者全面開放幾乎是不可能的。為了維護數據的安全性,必然以犧牲數據的開放性和透明性為代價,而數據開放性、透明性的不足必然影響政治大數據的信度與效度,缺乏透明性和開放性極大地限制著大數據方法的應用。同時,大數據的核心挑戰(zhàn)在于廣受關注的數據信息缺乏科學研究的效度和信度。也就是說,大數據時代的數據測量存有“大數據分析的陷阱”,面臨嚴重的信度和效度問題,存在不可忽視的預測誤差。大數據分析的陷阱主要源于:第一,“大數據傲慢”,即研究者假定大數據是傳統(tǒng)數據采集和分析方法的替代而不是補充。然而,大數據并不意味著人們可以忽視信度、效度和數據相依等基本測量問題。第二,出于經濟和政治利益的考慮,大數據提供者或使用者經常性地調整數據算法,導致研究者不僅無法獲得穩(wěn)定且可比的測量數據,更缺乏對數據生成過程的基本知識。第三,在大數據面前,研究者處于被動態(tài)勢,因為大數據提供者或使用者所提供的數據并不穩(wěn)定且具有可比性的測量數據不多,研究者缺乏對數據生成過程的基本知識,而且所使用的數據極有可能是經過特殊處理、有意篡改、未能反映事件原貌的錯誤數據,數據質量相對較差,有用數據信息很少[7]。在互聯(lián)網和各種數據庫平臺,很多數據相互復制、重復引用、價值不高,有些有用的信息卻沒有經過任何整理與加工,組織零散、格式特殊,難以提取和利用,從而影響政治學研究成果的可信度。數據質量是影響政治學研究科學化水平的重要變量,也是有效理解政治現象、準確把握政治生活運動規(guī)律的前提條件。政治大數據開放性和透明性的不足直接影響了中國政治數據信息缺乏科學研究應該具備的效度和信度,制約了政治學者對中國政治現象的準確把握和未來發(fā)展趨勢的科學研判。
我國正處于現代化轉型和全面構建現代國家治理體系的關鍵時期,中國政治學理應為現實的中國政治發(fā)展提供足夠的學術養(yǎng)料和學理支撐。大數據時代的到來為中國政治學研究提供了千載難逢的機遇,運用更為精確的數據分析技術增進對現實政治的理解,精準把握政治事物之內在關聯(lián),探尋中國政治發(fā)展的內在邏輯與一般規(guī)律,為國家治理現代化提供堅實的理論指導。同時,中國政治學及其研究者在大數據時代顯現出明顯的不適應性,對政治大數據收集、使用和分析的意識淡薄,政治數據收集的系統(tǒng)性不足、信度效度不高、連續(xù)性不強等問題頻現,同時大數據分析的技術人才嚴重缺乏,直接制約了中國政治學的學術發(fā)展和理論建構。
四、大數據時代中國政治學發(fā)展的應對之策
積極應對大數據技術對國家安全提出的嚴峻挑戰(zhàn),實乃中國政治學發(fā)展的關鍵議題。為了順應大數據時代國家治理的客觀要求,我國成立了國家安全和信息化領導小組,積極致力于將大數據方法應用于推進國家治理體系和治理能力的現代化。大數據時代推進中國政治學發(fā)展的具體應對之策表現為:
?。ㄒ唬┝⒆阒袊F實,破除數據迷信,實現研究方法與理論構建創(chuàng)新的有機結合,提高政治學對現實政治的解釋力
國家治理問題是當下中國政治學研究的關鍵議題,大數據技術為國家治理現代化提供支點支撐與技術保障。利用可視化分析、
數據挖掘算法、預測性分析對結構化和非結構化的政治大數據進行快速處理并獲取有價值的信息,能夠有效提升國家治理能力。中國政治學亟需加強對執(zhí)政黨治理體系、政府治理體系、市場治理體系和社會治理體系的研究,全面系統(tǒng)地理性評估治理制度的運行效果,探索治理體制機制運行的內在機理,為中國特色社會主義制度的完善和鞏固提供理論指導。但是,在壓力型體制下,官員為了晉升而盲目追求政績,政治錦標賽模式下的數據收集存在瞞報、少報、漏報、不報行為,報喜不報憂,政府統(tǒng)計數據含金量嚴重不足[19]。同時,政府、商業(yè)和社會組織常常基于數據安全問題,中國公共信息的開放度和透明性嚴重不足,政治大數據的信度和效度不高,信息扭曲和數據失真往往誤導學術研究。中國政治學要破除數據迷信,綜合運用學者的常識、直覺和理性,反復比對各種數據來源,同時以參與觀察、抽樣調查、深度訪談等傳統(tǒng)研究方法為補充,增強研究資料的真實性和可信度。更為重要的是,中國政治學研究者要加強理論自覺,提升學術話語體系和理論體系的創(chuàng)新能力,直面中國政治發(fā)展和國家治理的現實問題,在研究方法和理論體系雙重創(chuàng)新的過程中不斷提升政治學對現實政治的解釋力。
?。ǘ┘訌妼W科隊伍建設和人才培養(yǎng),加強跨學科交流協(xié)作,形成多學科優(yōu)勢互補、共同促進與成長的格局
大數據時代對政治學者提出了新要求,需要掌握從海量數據中挖掘有價值信息和數據信息的管理、存儲和分析能力,為政治學研究提供堅實的數據支撐。政治大數據將催生一種新型職業(yè)——政治數據分析師,而且具有豐富經驗的政治大數據分析人才將成為學術研究、政治應用、公共服務和輔助決策等領域的稀缺資源,政治大數據將驅動政治學的學術研究、政治應用和公共服務的大變革與大轉型。面對大數據時代的到來,政治學研究者應加強對
數據挖掘、
統(tǒng)計分析、自然語言處理以及
機器學習等技術方法的培訓與學習,提高數據的處理和分析能力,加強與國外學者的對話交流。大數據技術加深了各學科之間的交流空間,科學技術的發(fā)展促進了學科之間內部的交叉融合,中國政治學的發(fā)展亟需汲取自然科學、計算科學、信息科學發(fā)展的最新成果和養(yǎng)料,大力推進政治學交叉學科的成長與發(fā)展。為了更好應對大數據時代的挑戰(zhàn),各個學科之間需要共建一個所有學科能夠共享的巨型數據庫,形成歷時性共時性的數據鏈,豐富各學科的數據量,提高數據使用質量,達到數據共享,為社會科學研究提供有價值的數據信息,促進各學科的共同成長與進步。
?。ㄈ⒋髷祿夹g上升為國家戰(zhàn)略,通過資金扶持和政策供給以促進中國政治學的大繁榮與大發(fā)展
政治數據的資源化,使得政治大數據成為所有公民和政治學研究者的重要戰(zhàn)略資源,激發(fā)公民的政治參與熱情和政治學者的研究靈感。大數據技術蘊含著重要的戰(zhàn)略意義,我國政府應當加大投資研發(fā)力度,積極將“大數據戰(zhàn)略”上升為國家戰(zhàn)略。中國政治學的發(fā)展與國家建設的戰(zhàn)略目標緊密相關,為現實的政治發(fā)展與國家治理提供政策建議和學理支持是每個政治學者責無旁貸的義務。面對大數據時代的嚴峻挑戰(zhàn),黨和政府應該積極出臺相關法律法規(guī)和政策制度,聚國家之力收集更多數據,實現政治大數據在學者與政府部門之間的共享。此外,各級政府及其職能部門應該轉變治理理念,除了涉及國家利益和公共安全的數據不宜公布之外,應將社會治理、行政行為、公共服務、市場和社會監(jiān)管等領域的數據向民眾與學者公開,為中國政治學的發(fā)展構筑扎實的數據資料支撐。同時,云處理是政治大數據的基礎性設施,
云計算技術是產生政治大數據的基礎性平臺,需要政府資金的大力資助。政府有關部門應該聯(lián)合建立中國政治大數據及政治云平臺,更好地發(fā)揮政治大數據和政治云在國家安全和網絡空間安全以及在經濟和社會發(fā)展中的重要作用。因此,國家應當制定政治大數據研究開發(fā)的戰(zhàn)略規(guī)劃,將政治大數據的研究成果融入到國家治理和社會治理的各個領域和環(huán)節(jié),通過資金支持和政策供給促進政治學學科的大發(fā)展與大繁榮。
隨著大數據技術的快速發(fā)展,政治大數據很有可能激發(fā)政治學研究范式的革命。政治學者的思維應該隨之進行適應性調整,以實現研究方法和理論建構雙重創(chuàng)新的有機互動。隨著
數據挖掘、
機器學習、人工智能和3D打印等相關技術的發(fā)展,中國政治學研究的對象和方法將實現由傳統(tǒng)的1.0時代向2.0時代的跨越。中國政治學的研究亟需加強與自然科學、計算科學、信息科學和其他人文社會科學如心理學、社會學、經濟學之間的跨學科協(xié)作,增加學科之間的優(yōu)勢互補和協(xié)同創(chuàng)新,彌補自身研究方法的不足,擴寬研究視野,大力提升學術研究的科學化規(guī)范化水平。政治學研究者也需要在認清自身缺陷的同時,理性看待大數據所引發(fā)的技術進步,扎根于中國政治現實,夯實政治學科的理論基礎,構建符合中國國情、能夠解決現實政治問題和預測中國政治未來發(fā)展趨勢的政治學理論體系。
五、結論
大數據時代是將海量、多樣化、流動速度快且實時性強的數據視為核心資產的時代,政府、企業(yè)、社會組織和公民的行為習慣、偏好選擇等都可被視為是高度數據化的。大數據將帶來一場社會變革,特別是國家和社會治理領域的變革,大數據技術已經開始逐漸滲透到中國國家治理的各個層面,對國家治理理念、治理體系和治理工具等產生深遠影響。大數據為政治學研究提供了全新的發(fā)展機遇,有利于創(chuàng)新政治學研究方法和理論體系,拓展政治學的問題領域和研究空間,更好地為現實的國家治理和政治發(fā)展服務。然而,大數據的基礎設施建設、技術與人才保障的缺失,數據的標準化、開放性與透明度的不足,相關的數據管理制度尚不健全,研究者大數據意識缺乏、分析技能不夠等難題影響著中國政治學的進一步發(fā)展。為了更好發(fā)揮大數據對現代國家建設、政治學研究的服務支撐作用,既要強化政治學自身的學科建設和基礎理論研究,加強學科之間的交流與協(xié)作,更要從國家層面將政治大數據上升為國家戰(zhàn)略,提供學科大發(fā)展與大繁榮的政策支持和資金扶持,為中國政治學研究打造更高更好的數據平臺,實現中國政治發(fā)展與政治學學科發(fā)展之間的良性互動。
數據分析師培訓
CDA數據分析師考試相關入口一覽(建議收藏):
? 想報名CDA認證考試,點擊>>>
“CDA報名”
了解CDA考試詳情;
? 想學習CDA考試教材,點擊>>> “CDA教材” 了解CDA考試詳情;
? 想加入CDA考試題庫,點擊>>> “CDA題庫” 了解CDA考試詳情;
? 想了解CDA考試含金量,點擊>>> “CDA含金量” 了解CDA考試詳情;