
北京焦灼?上海頹廢?大數(shù)據(jù)如何解讀城市性格?
城市如人,在形成的過程中也會(huì)顯現(xiàn)出獨(dú)特的性格。具有特殊文化品格和精神氣質(zhì)的城市,無疑是最具吸引力而叫人難忘的。但你是否想過,如何用大數(shù)據(jù)深度探尋一個(gè)城市專屬的性格特色,了解城市心理?在1月4日的數(shù)據(jù)俠線上實(shí)驗(yàn)室,DT君邀請(qǐng)到城市象限的地產(chǎn)業(yè)務(wù)總監(jiān)張希煜,她通過挖掘分析歌詞、豆瓣、點(diǎn)評(píng)等多維數(shù)據(jù),對(duì)城市性格特征進(jìn)行輪廓側(cè)寫,有趣生動(dòng)地為我們講述了如何用大數(shù)據(jù)解密城市性格。
何謂城市性格?
說到城市性格,也許大家會(huì)覺得城市性格是一個(gè)復(fù)雜且充滿神秘的話題。首先,我將從人的性格研究開始講。因?yàn)檫@是所有科學(xué)研究當(dāng)中最為通俗化的內(nèi)容,任何一個(gè)人有可能不知道某個(gè)專業(yè)領(lǐng)域的研究,但他一定知道關(guān)于人的性格科學(xué)或偽科學(xué)的研究,比如大家接觸到最多的星座、血型、八字的研究。
我把人的性格研究劃分成了成因研究和表現(xiàn)研究?jī)蓚€(gè)部分。
從成因研究上來看,這三個(gè)類型對(duì)城市性格研究有較大的借鑒意義,可以借鑒到分析城市性格的類型化研究中去。
一是星座、血型、八字類的迷幻研究,它的一大特點(diǎn)是會(huì)充分折疊一切可以觀測(cè)的現(xiàn)象,能在折疊中尋找出凸顯話題性的方式,從而訊速博取大家的關(guān)注,形成共鳴。這可以對(duì)應(yīng)到文人作家是如何描述城市特點(diǎn)的,他們會(huì)提取一些非常抽象的內(nèi)容,以一種比較具有感染力但不全面的方式去表達(dá),從而形成對(duì)一個(gè)城市的簡(jiǎn)單感性的描述。
二是神經(jīng)生理觀能類的降維研究,人的性格和腦功能、生理結(jié)構(gòu)、神經(jīng)系統(tǒng)有很大的關(guān)系,這類研究是把高度復(fù)雜、多維的結(jié)構(gòu)還原到較單純的物理基礎(chǔ)內(nèi)容,從而去探究它的成因和表現(xiàn)的過程。對(duì)應(yīng)到城市研究,就像是通過城市空間有形可見的物理功能性元素,去探究城市性格的表現(xiàn)。
三是生活史社會(huì)影響類的溯源研究,主要針對(duì)如何挖掘過去的事情,包括環(huán)境變化是如何影響性格形成的。這可以對(duì)應(yīng)到我們對(duì)城市文化溯源、發(fā)展歷程的研究中。
個(gè)體間的區(qū)別促生個(gè)性,對(duì)城市來講也是這樣——由于氣候、歷史、建筑、習(xí)俗、方言、食性等等諸多不同,城市才會(huì)有血肉有靈魂,謂之“城市性格”。研究一個(gè)城市的城市性格,不可避免地要去做一個(gè)全面的分解。
我們認(rèn)為城市性格是從物理到心理的。
其中城市空間是我們所在城市性格展示的空間載體,包括了建筑元素和交通元素;城市場(chǎng)景由我們的交互過程、認(rèn)知、情感、行為建構(gòu);另一方面,我們也是城市個(gè)體化的成員,集聚成群體化的方式去呈現(xiàn)城市性格,我個(gè)人認(rèn)為城市成員是城市性格最為核心的內(nèi)容。
所以綜上所述,城市性格是一種城市特性的集合,是在城市空間和城市場(chǎng)景的影響之下,城市成員所表現(xiàn)出來的特點(diǎn)和特征。
城市性格與大數(shù)據(jù)間的碰撞融合
類比人的性格,我們通過行為情感和認(rèn)知反映關(guān)注城市性格特質(zhì),而大數(shù)據(jù)是作為城市性格的素材。
這個(gè)素材主要是三個(gè)層面:
一是社交網(wǎng)絡(luò)類的信息網(wǎng)站上提供的廣泛文本信息,它和我們一般接觸到的純數(shù)據(jù)最大的區(qū)別是,文本信息是一種信息量大且折疊程度高的信息,其中的分析內(nèi)容有很大的空間可以去主觀操作、創(chuàng)作。
二是社交網(wǎng)絡(luò)類網(wǎng)站提供的對(duì)某一個(gè)信息傳播方式及傳播范圍的指向性數(shù)據(jù),這為我們提供了觀測(cè)每一個(gè)貢獻(xiàn)信息的人之間關(guān)系的方式。我們可以通過這些用戶是否對(duì)同一件事情發(fā)表評(píng)論、是否參與同一個(gè)活動(dòng)、是否分享了類似的內(nèi)容等途徑去構(gòu)建用戶之間的關(guān)系。
三是對(duì)象關(guān)系,主要是通過挖掘用戶與用戶之間、參與者與參與者之間的內(nèi)在聯(lián)系,比如通過豆瓣同城,可以將關(guān)注同一類或同一個(gè)活動(dòng)的用戶建立成一個(gè)群組,這樣他們就有了一個(gè)維度上聯(lián)系。
在基于種種途徑去挖掘城市性格時(shí),實(shí)際上是在建立一個(gè)更為豐滿的城市感知。
通過和其他傳統(tǒng)城市感知方式來對(duì)比,當(dāng)我們?nèi)ピ噲D建立城市性格時(shí),實(shí)際上是在挖掘一個(gè)城市發(fā)展的內(nèi)部動(dòng)機(jī)。那么它的源頭是什么?這是一個(gè)很好的視角,因?yàn)槿绻?duì)比一些傳統(tǒng)的研究方式,大家很容易發(fā)現(xiàn)如果僅僅是以建立因果聯(lián)系就去做發(fā)展預(yù)判,會(huì)導(dǎo)致對(duì)城市的預(yù)測(cè)是扁平的。
焦灼的北京 VS 頹廢的上海
談到各個(gè)城市的性格,很多人會(huì)第一時(shí)間想到上海與北京。它們是近代以來中國(guó)的兩個(gè)最大的都市,一南一北,互為“他者”,無論是城市形態(tài)、社會(huì)分層,還是城市景觀、文化風(fēng)格,都呈現(xiàn)出鮮明的對(duì)比。
對(duì)北京和上海的比較,永遠(yuǎn)是大家樂此不疲的話題。那么對(duì)生活在這兩個(gè)城市的人來說,他們所懷的城市情感是怎樣的呢?
為了找到答案,我們團(tuán)隊(duì)在去年5月做了一個(gè)研究:通過挖掘北京和上海歌詞文本信息探測(cè)其城市情感,我從中節(jié)選了一些研究結(jié)果展示。
我們提取了“離開”和“留下”兩個(gè)對(duì)立性的詞語(yǔ)作為指向詞,用以評(píng)估兩座城市,大家通過詞頻可以明顯看到,相比于上海,北京是一座在離開和留下之間非常糾結(jié)掙扎的城市。
這張圖是類比語(yǔ)言學(xué)研究方式后建立的詞庫(kù):
我們通過詞庫(kù)來對(duì)比兩座城市詞性的相似和異同,最后建立了一個(gè)形容詞列表。從中我們發(fā)現(xiàn)北京會(huì)有更多積極的詞語(yǔ),描述感情更為激烈,色彩更為明確;而上海會(huì)更多地使用一些私人化的詞匯,表現(xiàn)更多的是朦朧的情感。
另外關(guān)于歌詞,我們建立了一個(gè)詞與詞之間聯(lián)系的主成員分析圖表,具體如下圖:
我們團(tuán)隊(duì)也在試圖去建立一個(gè)基于文化地圖之上的城市詞頻地圖,希望能夠挖掘到更為廣泛的語(yǔ)料信息,通過詞與詞之間的關(guān)聯(lián),挖掘城市背后的故事,目前還在起步階段。
選餐廳:北京追網(wǎng)紅,上海覓小眾
俗話說“民以食為天”,飲食也是構(gòu)成城市性格必不可少的一部分。我們通過分析大眾點(diǎn)評(píng)的數(shù)據(jù)做了關(guān)于兩座城市推薦餐廳的研究,其中數(shù)據(jù)主要是從大眾點(diǎn)評(píng)上的社區(qū)推薦上爬取了大家推薦的不同商鋪信息和傳播情況。
通過對(duì)比北京和上海的推薦數(shù)據(jù),我們發(fā)現(xiàn)在北京大家更傾向于去推薦人氣餐廳、網(wǎng)紅餐廳、爆款餐廳,而在上海大家更喜歡推薦小眾、有特色的餐廳,且推薦的接受度比北京要高一些。
當(dāng)然這只是我們巨大研究鏈條當(dāng)中小小的一環(huán),但從這個(gè)小細(xì)節(jié)上可以看到兩座城市的性格差異。北京更傾向于追求人氣、熱鬧的消費(fèi)氛圍,但上海相對(duì)于北京而言,更看重小眾、獨(dú)立、私人化的消費(fèi)氛圍。
比文化:北京愛歷史,上海重商業(yè)
文化是時(shí)間的沉淀,更是城市永恒的追求,一個(gè)具有特殊文化品格和精神氣質(zhì)的城市,無疑是最具吸引力而叫人難忘的。那么北京和上海在城市文化上相比又如何呢?
我們爬取了豆瓣同城上的數(shù)據(jù),這些數(shù)據(jù)內(nèi)容包括在城市范圍內(nèi)發(fā)生的文化活動(dòng)的名稱和性質(zhì)、參與者的發(fā)生時(shí)間、消費(fèi)門檻、文字描述等信息。
我們利用這些數(shù)據(jù)做了關(guān)于活動(dòng)特性、活動(dòng)參與者、活動(dòng)發(fā)生地點(diǎn)等分析。以下兩張地圖是根據(jù)北京和上海豆瓣同城上的活動(dòng)數(shù)據(jù)(活動(dòng)距離商圈、文明古跡、老城區(qū)等的距離)進(jìn)行的分析。
通過這兩張地圖可以明顯發(fā)現(xiàn),北京的文化活動(dòng)距離歷史街區(qū)、文化遺產(chǎn)更近一些,而上海的文化活動(dòng)更靠近一些商業(yè)機(jī)構(gòu)和商圈?;谶@一結(jié)果可以猜測(cè),北京的文化活力、文化內(nèi)容更為明顯地受到了其歷史文化的影響;而上海更為核心的發(fā)展動(dòng)力是其商業(yè)文化或是商業(yè)動(dòng)機(jī)。
下面這一張圖是關(guān)于活動(dòng)類型的對(duì)比:
我們依據(jù)活動(dòng)內(nèi)容的描述將其劃分成兩個(gè)類別,第一類是傳統(tǒng)文化類的活動(dòng),包括京劇表演、手藝表演、城市文化資源分享等;另外一類是創(chuàng)業(yè)類的活動(dòng),主要是工作坊、演講培訓(xùn)、游戲等。
那么從比例上,大家可以發(fā)現(xiàn)北京的傳統(tǒng)文化活動(dòng)明顯高于創(chuàng)業(yè)類文化活動(dòng),而在上海這個(gè)數(shù)值上則很接近。這更明顯的反映,商業(yè)文化對(duì)于文化活動(dòng)在上海的滲透,也從側(cè)面表現(xiàn)出上海的城市性格更傾向于追求一種價(jià)值的分享,而北京更多的是關(guān)于文化體驗(yàn)、傳承的分享。
小區(qū)名:北京喜復(fù)古,上海崇洋氣
除了情感、飲食和文化,北京和上海在小區(qū)命名上也存在著很大的差異。
我們對(duì)比了不同城市住宅小區(qū)的命名,通過把小區(qū)名稱、小區(qū)位置、小區(qū)類型、房?jī)r(jià)規(guī)模等數(shù)據(jù)提取出來進(jìn)行一系列研究。從中我們發(fā)現(xiàn)了一些很有意思的成果,下面節(jié)選了北京和上海的兩個(gè)小片段。
北京(尤其是在2005年以后)的小區(qū),在命名上喜歡田園風(fēng)或是中國(guó)風(fēng),而上海則更偏愛國(guó)際經(jīng)典情,下圖列表上有幾個(gè)例子:
大家可以看到像耕天下、禮士閣以及江南山水、揚(yáng)州水鄉(xiāng)這種“CP感”明確的小區(qū)名字越來越多;而在上海則會(huì)看到更多舶來詞,如城市經(jīng)典高迪、莫奈莊園、硅谷商墅等。
這些名字也反映出了所在城市居民的價(jià)值取向,我們研究了兩種類型名字在整個(gè)城市小區(qū)中的占比情況,可以看到相對(duì)來說北京用田園復(fù)古風(fēng)的命名會(huì)更多一點(diǎn),上海則用國(guó)際風(fēng)的命名會(huì)稍多一點(diǎn)。
第二張圖是關(guān)于兩種風(fēng)格房?jī)r(jià)的對(duì)比,由于涉及到房?jī)r(jià)數(shù)據(jù),數(shù)據(jù)比較敏感,所以很難橫向?qū)Ρ?,我們是通過對(duì)比這一類型房子均價(jià)大概是全市均價(jià)的多少倍數(shù)得到的。很容易發(fā)現(xiàn)在北京,以復(fù)古風(fēng)命名的小區(qū)明顯會(huì)賣得更貴一些,而上海則是相反。
以上只是城市象限研究的一部分,但我們的研究不止這些,目前我們還有一個(gè)腦洞是關(guān)于如何通過城市地名的命名方式去挖掘城市的性格,觀察胡同街道名稱、橋梁道路名稱、水系名稱等數(shù)據(jù),從中發(fā)現(xiàn)城市的價(jià)值取舍、希望寄托、外來文化、紅色文化等對(duì)城市的影響。
舉例來說,通過看全國(guó)有多少紅旗街、紅旗路以及分布在全國(guó)的哪些地區(qū);又或者通過對(duì)比北京胡同和上海弄堂的命名,從而發(fā)現(xiàn)當(dāng)中寄托了城市什么樣的愿景;還有歷史傳流下來的文化圖騰的命名方式……這些都能讓我們發(fā)現(xiàn)各個(gè)城市的性格特點(diǎn)。
關(guān)于我的分享就到這里,希望能給大家?guī)韱l(fā)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10