
大數(shù)據(jù)與歷史學研究如何關聯(lián)
“大數(shù)據(jù)”(Big Data)出現(xiàn)的時間不長,但就其影響力來說,無疑對社會科學的影響甚巨,一時間各個學科關于大數(shù)據(jù)及其相關領域的研究呈現(xiàn)井噴狀態(tài)。歷史學界對于以“大數(shù)據(jù)”為核心一系列新理念的接受與回應,與其他學科相比,相對來說比較滯后,有學者戲稱“歷史學是變化最慢的學科”。為適應新的學術生態(tài)和研究形勢,2016年11月4-6日,由南開大學歷史學院與《史學月刊》編輯部聯(lián)合主辦的“首屆新史學青年論壇:大數(shù)據(jù)時代的史料與史學”在南開大學隆重召開。會議通知自發(fā)布后,得到學界特別是青年學者積極響應,共計收到參會論文120余篇,經審查委員會認真評閱、審議和篩選,結合會議主題,最終入圍了43篇論文。
在開幕式上,南開大學校長助理于海、南開大學歷史學院院長江沛、河南大學副校長張寶明分別致辭,歡迎各位學者參會砥礪,并對于此次會議做了詳細的介紹與展望。另外,參加此次會議(含召集人)的還有王兆軍教授、陳志強教授、王先明教授、李金錚教授、侯建新教授、余新忠教授、付成雙教授、趙學功教授、王天根教授等專家學者,《史學月刊》郭常英主編、翁有為編審、周祥森編審、汪維真編審、呂滿文主任、徐瑩副編審、張秀麗編輯一行。此次參會論文涉及面雖相當廣泛,各位與會學者亦來自全國各地不同的院校與科研單位,青年才俊與史學專家匯聚一堂,但主要聚焦于以下五個論題:大數(shù)據(jù)的概念問題、大數(shù)據(jù)與歷史學研究、歷史學數(shù)據(jù)庫平臺的建設與構想、大數(shù)據(jù)的優(yōu)勢與缺陷和以“新視野、新材料、新方法”為核心的其他論題。會議分為兩個分會場,兩天共八個分小組進行了熱烈甚至尖銳的交流和思想對撞。
大數(shù)據(jù)的概念
教育部長江學者、南開大學數(shù)學院教授王兆軍,對于大數(shù)據(jù)的概念剝繭抽絲、追根溯源,介紹了數(shù)據(jù)的存儲、處理、分析、理解乃至應用的具體過程,并談了他對大數(shù)據(jù)與歷史學科如何關聯(lián)的認識。王兆軍指出,1922年11月,梁啟超在東南大學史地學會作了“歷史統(tǒng)計學”的講演,提出了“歷史統(tǒng)計學”概念。對于當代歷史學界來說,計量統(tǒng)計作為方法,并非一個新的事物。另外,多名與會學者(如郭輝、姜萌、馬衛(wèi)東、胡優(yōu)靜等)的論文和討論各個議題的過程中,皆涉及到了大數(shù)據(jù)概念及應用等相關問題。
大數(shù)據(jù)與歷史學問題的具體結合
關于大數(shù)據(jù)與歷史學具體的領域的研究實踐,是此次會議的重點之一。王哲在《基于多版本郵政輿圖的近代郵政網(wǎng)絡空間分析》中,圖文結合,結合表格與GIS分析,展示了20世紀初30年間郵政網(wǎng)點的空間分布和定量狀況;王濤通過《群像的描述與類型的分析:數(shù)字工具挖掘<德意志人物志>》一文,采用了人口學統(tǒng)計和類型分析兩種方法,對于《德意志人物志》(ADB)做了翔實的研究;張琰《中古政治?文本分析與E-考據(jù):淮南三叛再研究》一文,通過史料鉤沉,分析了王凌、毌丘儉、諸葛誕三人叛亂動機及與秦漢以來所形成“二重君臣秩序”之間的關系;楊凡在《大數(shù)據(jù)時代環(huán)境史史料運用》中更多了介紹了數(shù)據(jù)庫等電子資源在環(huán)境史研究中的作用與使用;明成滿《大數(shù)據(jù)背景下近代佛教史研究》一文,通過介紹有關佛教史研究的各色資料,致力于推動佛教史研究和轉變;張林峰《碑刻中工價的資料處理與運用:以大數(shù)據(jù)為研究工具的嘗試》一文,從所掌握的碑刻資料,分析了工價資料的使用方法與長時間支付規(guī)律;曾桂林的文章《大數(shù)據(jù)時代慈善史研究及其運動》(初稿)構想了大數(shù)據(jù)與慈善史具體研究的關系;王天根《大數(shù)據(jù)時代的珍稀史料考釋及史學價值所在:大英圖書館藏“發(fā)信件簿”數(shù)據(jù)化處理及其反映清帝國通訊之側影》一文,通過中央與地方通信頻率等一般性情況,試圖窺見其通訊系統(tǒng)的一面;韓健夫在《大數(shù)據(jù)時代視野下歷史氣候研究的史料與史學:以游牧民族遷移及王朝興亡為例》中,集成以往研究成果和各類數(shù)據(jù),進行了一個總體性考察;伍斌通過《大數(shù)據(jù)與國內美國史研究的機遇與挑戰(zhàn)》一文,論述了大數(shù)據(jù)與當前美國史研究的相關問題及展望;王小紅《<全宋文>北宋作者的時空分布特征:基于QGIS技術的研究》一文,則主要從QGIS技術出發(fā),做了一個關于《全宋文》的樣本分析;張昊蘇的文章《紅學與E-考據(jù)的二重奏:讀黃一農<二重奏:紅學與清史的對話>》對黃一農著作及E-考據(jù)概念做了自己的理解;張國文《數(shù)字化技術在文博考古中的應用》一文,對數(shù)字化技術、大數(shù)據(jù)對于文物考古領域的影響和可以發(fā)展的空間做了宏觀論述。
數(shù)據(jù)庫、電子資源建設
本次會議,特別邀請Gale公司,著重介紹了目前數(shù)據(jù)庫-電子資源的建設情況,包括大英圖書館報紙(1600-1950)、《泰晤士報》數(shù)字典藏、《金融時報》數(shù)字典藏、十八、十九世紀作品在線、美國解密檔案在線、美國《國家地理》雜志在線典藏等大型數(shù)據(jù)庫情況;在數(shù)據(jù)庫的應用方面,程斯宇在《數(shù)據(jù)庫與地方黨史文獻的發(fā)掘與利用:以讀秀學術搜索和1940年代中共華北黨組織整風整黨相關史料為例》一文中,介紹了“讀秀數(shù)據(jù)庫”和地方黨史文獻在黨史領域研究的助益;吳玲通過《大數(shù)據(jù)時代“全史料數(shù)據(jù)平臺”的構想與建設:以現(xiàn)有的歷史資料數(shù)據(jù)庫為例》一文,介紹了日本的歷史資料數(shù)據(jù)庫,對“全史料數(shù)據(jù)平臺”建設提出一些構想與方案;張欣在《古籍、學術論著數(shù)字化與中國古史研究》(初稿)一文中,集中探討了古籍數(shù)字化、數(shù)據(jù)庫建設諸問題,對此提出思考與構想;胡越英從《以羅斯??偨y(tǒng)圖書館為例談歷史文獻數(shù)據(jù)庫的運用》一文,通過對羅斯??偨y(tǒng)圖書館的推介,引申出國內數(shù)據(jù)庫建設、應用的相關問題。
大數(shù)據(jù)的優(yōu)勢與缺陷等問題
大數(shù)據(jù)時代下,機遇與挑戰(zhàn)并存,各位學者對此均做了相當激烈的討論和反思。姜萌在《大數(shù)據(jù)會對史學產生根本沖擊嗎?》一文中,解析了大數(shù)據(jù)與一些歷史認識論的基本問題;馬衛(wèi)東在《大數(shù)據(jù)時代史學的多元發(fā)展趨勢》中指出,目前史學研究存在“史料樣態(tài)、研究主客體、方法認識論、傳播模式”多樣化四個方面,以此為核心解析了論題;胡優(yōu)靜《歷史學數(shù)字資源利用的陷阱與誤區(qū)》以“四個陷阱”為核心,對大數(shù)據(jù)使用提出一些憂慮,做了詳細的論述;顧曉偉《大數(shù)據(jù)時代的人文關懷:淺議史學方法革新和史學觀念的互動》一文,從史學方法革新與史學觀念互動層次,對大數(shù)據(jù)問題進行回應;許兆昌《當記憶成為常態(tài):歷史學何去何從》從信息時代變動和史學發(fā)展過程等視角對歷史記憶的研究進行介紹,也關聯(lián)了大數(shù)據(jù)等命題。
其他相關論題
除上述論題外,另有夏炎《地方官應災的德政記錄:歷史特殊性與史家選擇—以<泗州大水記>為中心》(討論稿)、毛立坤《地狹人稠型城市的治理與困境:以港九時期(1860-1897)的香港為例》、劉芳《1900年美國對中國領土的覬覦:以美國國家檔案館館藏外交、軍事檔案為中心》、杜恩義《1913-1914年西方撤退駐華軍隊問題考察》、賀江楓《通敵與抵抗之間:1940-1942年閻錫山政治選擇的歷史考察》、王玲《國共兩黨、民間力量與河南孟縣的抗日游戲戰(zhàn)》,雷娟利《二戰(zhàn)時“中緬印”戰(zhàn)場史口述文獻述評》、魏兵兵《西方學界蔣介石研究綜述》、李軍全《節(jié)慶與政治傳播:戰(zhàn)時華北中共根據(jù)地的春節(jié)宣傳(1937-1949)》、張弘毅《關于九一八前后中國東北地區(qū)對日貿易的幾個問題》、陳明《南京國民政府行政督察專員制度的創(chuàng)設》、楊雙利《史料、口徑與數(shù)字:論清代賑災問題及其相關問題》、亓佩文《亞述和巴比倫王表芻議》、梁躍天《民族保守主義與保守主義實踐的形成:1792-1793年英國反改革運動》、白爽《知識即權力?英國醫(yī)生權力的發(fā)展和變化趨勢(1800-1948)》、白云天《阿拉伯的希特勒還是今天的薩拉?。盒睦碚系K與美國和阿聯(lián)之間的戰(zhàn)略的矛盾(1957-1959)》、王娟娟《冷戰(zhàn)時期美國守護兒童的純真與反對漫畫書運動的開展》等文章,各位學者運用了新發(fā)現(xiàn)的資料、新的方法、從新的理念甚至舊題新做,對所構論題做了相當深入的探索。
優(yōu)勢互補還是史學危機:一個未完的思考
歷史學同時也是“歷史性”的學科,反映著時代的歷史。目前學者自覺或主動的運用“大數(shù)據(jù)”進行歷史學研究,無疑是新技術、新方法沖擊下的實效回應。如王先明教授在第一場分會場總結所言:類似于1986年10月,由南開大學、天津人民出版社、《歷史研究》編輯部等單位共同發(fā)起,在天津召開了第一屆中國社會史研討會。這次會議大致上可以看作是學術界有計劃地恢復社會史研究活動的開始,社會史自此也有了30年廣泛的發(fā)展與深化。如今各類工具日異日新,我們在此共襄此會。若不出所料,學界將會繼續(xù)舉辦類似學術交流,關于大數(shù)據(jù)、新工具和新方法與史學關系的討論,將有可能成為一種新的趨勢、研究模式與學術取向,期待青年學者做出更大的成就,這可能是此次會議的長期意義。
在閉幕式,各位學者交流感想,總結分會場相關情況。江沛、侯建新等教授等則更多的呼喚青年一代史學工作者,不斷完善自己知識結構,自覺的推動學科交流乃至學科綜合,充分利用大數(shù)據(jù)時代下歷史研究的便利,力求使得學術研究走向多角度、多視野、多學科的新境界。借助于多學科、大數(shù)據(jù)等路徑,或將成為史學研究的中堅力量。
當然,諸多學者也認識到,“大數(shù)據(jù)”某種程度也會給史學研究帶來“恐慌與危機”。如今的歷史學研究,通過便利的檢索手段和數(shù)據(jù)庫技術,這種狀況影響到了學者的研究方式的改變。如何評估以大數(shù)據(jù)為核心的技術帶來研究樣態(tài)的變化,都是需要認真面對和慎重思考的問題。如姜義華在《大數(shù)據(jù)催生史學大變革》一文中所指:“大數(shù)據(jù)將量化研究廣泛引入各種歷史問題研究之中,但是,任何量化的東西,都有其邊界。目前各種數(shù)據(jù)庫所選錄的數(shù)據(jù),不僅存在既有資料本身的局限,還有建立數(shù)據(jù)庫時建立者自身標準的局限。使用數(shù)據(jù)庫者,選擇多少樣本,選擇什么類型的樣本,亦有極大的主觀性。因此,不能將量化研究的意義無限夸大,定量研究須與定性研究結合起來,成果方才可能有更多的科學含量”?!按髷?shù)據(jù)”作為一種前沿方法,在與歷史學研究結合時,稍加不慎,可能會出現(xiàn)一些“陷阱”,與會青年學者胡優(yōu)靜亦有此憂慮。
反思傳統(tǒng)的歷史研究,大數(shù)據(jù)與史學研究如何科學的融合,無疑是機遇與挑戰(zhàn)并存的,塑造界限與打破界限同構同生。物極必反,不能讓理性的“大數(shù)據(jù)”工具變成隨意解釋、盲目運用的“大忽悠”,這是一代史學工作者需大加追索的時代命題。作為一個學術研究的工具,“新方法”是否可以與傳統(tǒng)史學方法優(yōu)勢互補,相得益彰,這是我們未完的思考,也是超越此次會議本身的問題。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到決策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10