
城市科學大數(shù)據(jù)與社會物理學如何變革城市的發(fā)展_數(shù)據(jù)分析師培訓
共享體驗模式與社會紐帶模式服從相同的一般規(guī)則。對社會網(wǎng)絡中的每個人而言都是全新體驗的最大的可能性,發(fā)生在人們最不常去的地方。去遠處探索新想法是最有成效的,日常生活的普通體驗則通過在本地社區(qū)的參與被升華為社會規(guī)范。
托馬斯·杰斐遜(Thomas Jefferson)對18世紀的城市有一個著名的描述:“人性墮落的大陰溝?!钡牵越莒尺d時代以來,世界上的城市已經(jīng)成百倍地增長,而且這種增長并無減弱的趨勢?,F(xiàn)在,居住在城市中的人口比例是有史以來最高的。既然城市有高昂的生活費用和比生活費用更高的犯罪率、污染程度以及傳染病威脅,人們?yōu)槭裁催€會持續(xù)不斷地遷往城市?也許正如亞當·斯密所言:“城市中心既特別墮落又特別創(chuàng)新?!?/span>
盡管有關城市的研究已經(jīng)持續(xù)了一個多世紀,我們對于為什么城市能促進創(chuàng)新依然缺乏一個有說服力的模型。城市確實有創(chuàng)新:相比于農村地區(qū),城市更為有效地使用資源,產(chǎn)生更多的專利和發(fā)明,人均使用道路和服務更少。是否可以讓更多人居住在一起以獲得更有效的想法創(chuàng)新和更高的生產(chǎn)率?一些學者指出了技術擴散在創(chuàng)造智力資本中的作用,另一些人則闡述了層次化社會結構和專業(yè)化的作用。
專注于想法流而不是商品流
正如前面章節(jié)討論的那樣,社會網(wǎng)絡互動和想法流是團隊和企業(yè)里創(chuàng)意產(chǎn)出和生產(chǎn)率的主要推動力。這些社會物理學的概念在社會科學中幾乎是僅有的可擴展的概念,并且正如本章要介紹的那樣,這些概念完全可以超越小的團隊和企業(yè),擴展到城市層面,并通過這些大得多的社會網(wǎng)絡促成更高的生產(chǎn)率和更大的創(chuàng)造力。城市和公司一樣都是想法機器。
我和潘巍、格拉·戈沙爾 (Gourab Ghoshal)、科科·克魯姆(CocoKrumme)以及曼紐爾·塞布里安(ManuelCebrian)等學生和同事一起建立了一個數(shù)學模型,它基于在面對面距離內的人數(shù)來闡述社會紐帶如何推動城市里的想法流。正如我們在《自然通訊》(NatureCommunications)的一篇文章中描述的那樣,這是一個定量預測GDP和創(chuàng)意產(chǎn)出的簡單、自下而上、魯棒的模型。我們也已經(jīng)能夠說明,沿著社會紐帶的想法流可以準確再現(xiàn)城市特征,包括艾滋病毒感染率、電話通信模式、犯罪率和專利權率,等等。它也為我們提供了設計更具創(chuàng)意和效率的城市,盡可能減少犯罪和其他負面因素的研究成果。
值得注意的是,這種從社會物理學的角度看待城市的方法是與傳統(tǒng)的階層和專業(yè)化模型不同的。前者專注的是想法流,而不是后者描述的社會的靜態(tài)分割。這樣看來,社會物理學類似于用工廠之間的距離和運輸物品的成本等來解釋城市制造業(yè)有效性的模型。而它們的不同之處在于:社會物理學把城市和公司定位為想法工廠,因此專注于想法的流動而不是物品的流動。
從這個觀點看,社會物理學與社會學、地理學和探討人口密度與創(chuàng)新之間關系的經(jīng)濟學,以及沿著社會紐帶進行的傳播和創(chuàng)造力研究是一脈相承的。社會物理學新的重要貢獻在于把這些想法集成到單一數(shù)學模型中,并可用稠密、連續(xù)的行為數(shù)據(jù)以及能夠獲得的經(jīng)濟和社會結果數(shù)據(jù)來進行檢驗。社會紐帶和想法流在人類互動模式、移動模式和城市經(jīng)濟特征之間提供了簡單的生成鏈接,無需借助層次化、專業(yè)化或類似的社會結構概念。正如本章后續(xù)部分要闡述的那樣,真
正重要的是想法的流動,而不是階層或市場。
城市中的社會紐帶模式
城市中社會紐帶的模式可以通過如下概念描述:兩個人之間產(chǎn)生關系的可能性是由“中介機會”(intervening opportunities)的數(shù)量決定的。其核心思想很簡單:如果你在某群人中有許多“可能認識的人”,那么你與其中某個陌生人建立友誼的可能性就比較小。大衛(wèi)·利本諾爾(David LibeNowell)及其同事研究了一個日記網(wǎng)站的成員并繪制了他們與朋友和熟人居住距離的信息。他們發(fā)現(xiàn),對于大多數(shù)朋友而言,兩個人形成社會紐帶的可能性與在這兩人之間的地點上逗留的人數(shù)成反比。
在一個基于位置的社會網(wǎng)絡應用Gowalla中發(fā)現(xiàn)了類似的關系,Gowalla記錄個人及其朋友“簽到”的地點。研究人員使用這些數(shù)據(jù)可以知道朋友之間居住距離的遠近,以及朋友們去同一個地點的頻率。這一研究得到了一個簡單的數(shù)學方程,它描述了人們往往會和住在附近的人有較多的社會紐帶,并且隨著距離的增加,紐帶的數(shù)量也越來越少。
然而,這一關于社會紐帶的數(shù)學關系還有其他更為有趣的應用。例如,艾滋病這類疾病的傳播顯然依賴社會紐帶的分布,打電話模式也是如此(當然依賴方式非常不同)。打電話模式作為區(qū)縣人口的函數(shù)和艾滋病的感染率作為每平方英里人口密度的函數(shù),這是兩種非常不同的現(xiàn)象。然而,兩者都可以用通過分析網(wǎng)站與社會網(wǎng)絡所測量的距離與社會紐帶數(shù)量之間相同的數(shù)學關系來預測。
城市中所有的社會紐帶模式都能在更小規(guī)模的團隊結構中找到對應。正如在我們關于公司的研究(第4章和第5章)中所看到的那樣,親密的社會紐帶對參與有支持作用,因為這些人更有可能互相交談,從而進一步把想法轉變?yōu)樾袆?。遠距離的社會紐帶則起著探索的作用,因為我們在新環(huán)境中遇見“新人”,并從他們那里收獲新想法。
然而在公司里,在工作團隊和“其他人”之間通常有著明確的邊界。工作之外,在我們與其他人互動的整個模式中,探索和參與之間通常并沒有明確的邊界。也就是說,當我們考察所有的互動時,可以看到人們具有多個社會角色(例如母親、同事、公民、爵士樂愛好者等),并且每個角色涉及不同的人群,因此,在個人社會網(wǎng)絡中,參與和探索的功能是結合在一起的。
探索越多,城市越富足
前面的章節(jié)介紹了我的研究小組利用從手機、社會網(wǎng)絡和社會計量標牌等大數(shù)據(jù)源采集的數(shù)據(jù)所做的研究。觀察人類行為的另一個大數(shù)據(jù)透鏡是信用卡數(shù)據(jù)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11