
CDA數(shù)據(jù)分析師 出品
編譯:Mika
【導(dǎo)讀】
Jer Thorp是來自加拿大溫哥華的藝術(shù)家和教育家,目前居住在紐約。他的可視化藝術(shù)實踐中探索了科學(xué)和藝術(shù)之間的多重邊界。在本文中他分享了數(shù)據(jù)背后所蘊含的令人意想不到的重量。
今天我想跟大家聊聊兩件非常振奮人心的內(nèi)容,你們可能已經(jīng)猜到是什么了,那就是數(shù)據(jù)和歷史。
我不是個歷史學(xué)家,我不是來跟你們講歷史定義的,而是想讓你們通過一個框架看待歷史。
當(dāng)我們創(chuàng)造歷史,或是撰寫歷史文獻(xiàn)時,我們是在把過去發(fā)生的事銜接在一起變成一個故事。
讓我先來講一個我自己的故事。和大多數(shù)年齡相仿的計算機工作者一樣,我曾是個善于社交、受歡迎的年輕人,而且擅長運動的年輕人。和大多數(shù)年齡差不多的同行一樣,我深受蘋果公司的影響。
但是注意看我選的這個商標(biāo),左邊那個蘋果,不是右邊那個。我深受右邊那個蘋果的影響,就像每個人一樣。但是左邊那個蘋果,看看這標(biāo)志,是個彩虹,但是順序是錯的!真不知道蘋果公司是怎么想的。
但對蘋果公司我不想說太多,我想跟你們說一個機器的事兒。我現(xiàn)在回過頭來想,真是不可思議??!那是一個周三,是我大概12歲的時候,我還沒有電腦。到了周四,我就有了一臺電腦。
你能想象這變化嗎?翻天覆地的變化。沒有事物可以像電腦那樣改變我們的生活。
但我其實也不想聊電腦的事兒,我想聊聊電腦上的一個程序。程序的創(chuàng)始人不是左邊那個,右邊那個才是。大家知道右邊那人是誰嗎?從來都沒人知道,這是比爾·阿特金森。多虧比爾·阿特金森做的很多事,才有了我們現(xiàn)在每天在電腦上看到的東西。
▲ 喬布斯和HyperCard的開發(fā)人員比爾·阿特金森
但是我想重點說說比爾寫的一個程序叫做 HyperCard。HyperCard 曾是蘋果電腦的附贈品,為蘋果電腦使用者設(shè)計的,在電腦上編程時用。
▲ HyperCard
如今聽起來很瘋狂,這些程序不是我們?nèi)缃袷褂玫腶pp。app是有很大的預(yù)算和傳播度的,而這些程序只是很小的程序。有人用它來記錄當(dāng)?shù)鼗@球賽的比分,有人用來整理論文,有人用來做古典音樂的教學(xué),或者計算奇怪的天文日期。
當(dāng)然還有一些是藝術(shù)項目,這是我最喜歡的一個叫做“If Monks Had Macs”,是個非線性探索環(huán)境。
▲ If Monks Had Macs
HyperCard讓我感激我能生在這個時代,讓我有機會使用HyperCard。Hypercard是最后一個電腦自帶的,設(shè)計給用戶編程的附贈品。如果你告訴電腦的發(fā)明者們有那么一日,所有人都有了電腦,卻沒人知道如何編程,他們一定會覺得你瘋了。
讓我們快進(jìn)幾年,我最初的職業(yè)是藝術(shù)家。我用電腦創(chuàng)作一些小玩意兒,比如研究植物的生長系統(tǒng)。還有在這個例子中,我用像素間的顏色互換來模擬經(jīng)濟模式,調(diào)查這些系統(tǒng)是如何運作的,我樂在其中。
這個項目使我開始從事數(shù)據(jù)相關(guān)的工作,我對這些圖像的美觀性也很感興趣,這是伊朗和伊拉克。這個看起來像個鐘表,叫做“鐘表圖”。這是另一個鐘表圖的例子,在“希望”上疊加“絕望”。實際上是在“希望”上疊加"危機”,“希望”只有三次被"危機"覆蓋。
這一系列紐約時報作品的巔峰是幾年前,我嘗試把一整年的新聞?wù)系揭粡垐D中。于是這一整年的新聞人物,以及他們之間的關(guān)系都在這一張圖里了。
推特可視化案例-「剛剛到達(dá)」
由此,我對更活躍的系統(tǒng)產(chǎn)生了興趣。這個項目叫“剛剛到達(dá)”。我看人們發(fā)推特“我剛飛到夏威夷!”——你們懂的,人們總是不經(jīng)意地在推特上談到這些。“我真的不是在炫耀,但我剛到夏威夷“。
▲ 推特可視化項目--「剛剛到達(dá)」
然后我開始描繪人們的旅程,希望可以利用社交網(wǎng)絡(luò)和背后的數(shù)據(jù)建立個模型來跟蹤人們的動向。對流行病學(xué)家來說,這將是十分寶貴的信息。
推特可視化案例-「互道早安」
這是個類似的項目——它更有趣。在推特上看世界各地的人們互道早安。順便說一句,我才知道在溫哥華西岸的人真的比東岸的人起床晚,互相道早安也晚,東岸的人也更有冒險精神。
▲ 推特可視化項目「互道早安」
再給你們看一個項目,這個可能更實用,我試圖把開普勒項目的數(shù)據(jù)做成更易懂的圖像。我剛才給你們看的所有作品,都是做著玩的。
聽起來有點奇怪,但這就像HyperCard。我自己創(chuàng)造一些工具,然后我可以和一些人分享。但都是為了自己開心,做著玩的。
所以其實很難給這些工具明確的定位,我的創(chuàng)作介于科學(xué)、藝術(shù)和設(shè)計之間。從HyperCard開始直到今天,我都在建立可視化工具來幫助我理解各種系統(tǒng)。
如今我在紐約時報工作,我是個數(shù)據(jù)藝術(shù)家。工作期間,我接觸到很多有趣的項目。
今天會給你們看其中兩個。第一個是和馬克·漢森一起做的,馬克是加州洛杉磯的統(tǒng)計學(xué)教授和傳媒藝術(shù)家。馬克來時報時提過一個有趣,而又似乎顯而易見的問題。當(dāng)人們在網(wǎng)上傳播信息時,信息是如何從A傳到B,或從A傳到B、C、D的?
我們都知道人們在網(wǎng)絡(luò)上分享信息,卻不知道傳播過程中發(fā)生了什么。所以我們決定創(chuàng)造工具來探索這個問題,這個工具叫做Cascade。
我們看這些系統(tǒng)時,一件事導(dǎo)致另一些事,我們稱之為建立Cascade。這些Cascade是逐漸發(fā)生的,所以我們的跟蹤建模也需要一段時間。
▲ Cascade
很多人都在傳播紐約時報上的信息,因此Cascade看起來其實是這樣的。這是個常見的Cascade,最左下方是第一個事件,當(dāng)信息從一個人傳播到另一個人時,這個點向上沿y軸延伸 y軸是分離程度。同時向x軸延伸 x軸是時間。
現(xiàn)在我們可以從很多角度看這個問題,這是線型角度,這個是把線型堆疊,成為這樣的立體角度。
今天,時報每個月發(fā)表約7000篇文章,所以建立這個工具時很重要的一點是,把它建成一個可探索的模型,這樣人們可以在大量數(shù)據(jù)中挖掘他們需要的信息。
就像是給人們提供了一輛車,在這大量的數(shù)據(jù)中暢通無阻,這樣人們可以在大量數(shù)據(jù)中挖掘他們需要的信息。
實況中的Cascade 看起來是這樣的。
不得不說,這是一個重要的時刻。那么久以來,我們接受了太多假新聞。所以當(dāng)我們第一次看到這一幕時,就好像考古學(xué)家把灰塵從恐龍骨架上抖落一樣。
我們發(fā)現(xiàn)了并第一次看到,這些網(wǎng)絡(luò)共享信息的結(jié)構(gòu)。拿恐龍來打比方好像挺合適的,因為我們是在對這些事之間的關(guān)聯(lián),做概率性的推測。當(dāng)我們看著這些碎片信息做出假設(shè)時,我們盡力確保它們的嚴(yán)謹(jǐn)性。
推特是故事的一部分,敘事的一部分。我們在創(chuàng)建歷史,但它們不過是短暫的歷史。
這些大型的Cascades往往是最有趣的,當(dāng)然有些小型的Cascades 也是很有意思的。這是我很喜歡的一個 叫“rabbi cascade”。是拉比們(猶太教學(xué)者) 圍繞紐約時報中的一篇文章的對話。
實際上,宗教工作者休息時間非常有限,周六和周日他們好像不太能放假。
于是在這個Cascade里,有一群拉比在談?wù)撘粋€紐約時報發(fā)表的故事。其中一個拉比給自己取的推特用戶名很厲害叫“ The Velveteen Rabbi” (注:Velve teen Rabbit/絨布小兔子是一本英國兒童讀物,此處取名去掉了t)。如果沒有這個初步工具,我們永遠(yuǎn)不會找到這些信息,這些信息只會停留在某些角落,永不得見天日。把信息整合,然后建立敘事性結(jié)構(gòu),創(chuàng)作歷史,我發(fā)現(xiàn)了無窮的樂趣。
我兩年前搬到紐約,在紐約人人都有一個故事,是關(guān)于發(fā)生在2001年9月11日的那個重大事件。我自己的那個故事有些復(fù)雜,因為我花了很多時間在曼哈頓的9/11事件紀(jì)念碑。
9/11事件紀(jì)念碑的核心理念在于那些紀(jì)念碑上的名字,不是按字母順序排列,也不是按年份排列,而是通過可以體現(xiàn)遇難者之間的關(guān)系的方式排列。弟兄和弟兄一起,同事和同事一起,所以這個紀(jì)念碑考慮了種種連接,這些人曾經(jīng)在生活中的連接。
▲ 9/11事件紀(jì)念碑
我和一個叫做Local Projects的公司合作,做了一個算法軟件,來幫助建筑師們決定這個紀(jì)念碑的排列方式。
一共有將近3000個名字,將近1500個鄰接的請求。這些連接的請求,所以這是一個很密集的故事和敘事,需要在一個紀(jì)念碑上呈現(xiàn)。我和Jake Barton一起制作了這個軟件,讓建筑師可以首先制作一個可以滿足所有請求的布局,然后在某些地方做改動,從而可以表達(dá)他們想要的故事。
我想在我們這個社交網(wǎng)絡(luò)統(tǒng)領(lǐng)的時代,這個紀(jì)念碑是個與時俱進(jìn)的概念。因為這些現(xiàn)實中的社交網(wǎng)絡(luò),在紀(jì)念碑中能夠得以呈現(xiàn)。最令人感動的就是前去紀(jì)念碑,看到這些人的名字是如何彼此相鄰,來呈現(xiàn)他們在世時的生活的。
▲ 9/11事件紀(jì)念碑
那么,這些對于我們的生活有什么影響呢?
我不知道你們還記不記得,今年春天出了這么一件事,飽受爭議。人們發(fā)現(xiàn)在iPhone上,還有在電腦上,有大量定位信息被儲存。
蘋果公司回應(yīng)說,這些定位信息跟你們無關(guān),而跟你們居所的無線網(wǎng)絡(luò)有關(guān)。所以這跟你們無關(guān),而是跟你們在哪有關(guān)。
這是很寶貴的數(shù)據(jù),對研究者來說 這些移動數(shù)據(jù)像金子一樣寶貴。于是我們想到:有多少人都在用iPhone啊?在座的有多少人用iPhone?所以在這個房間里,就有研究者們很喜歡的大量的定位信息。
于是我們創(chuàng)造了一個叫做Open Paths的系統(tǒng),它可以讓人們上傳iPhone的數(shù)據(jù),并與研究人員建立代理關(guān)系來共享這些數(shù)據(jù),把這些信息貢獻(xiàn)給有需要的人。
Open Paths的初步模型很成功,我們收到了成千套的數(shù)據(jù)。我們制作了一個界面,讓人們可以看到自己的生活是如何展開的。從這些被你忽視在手機里的蛛絲馬跡中。我們沒有想到這個體驗會是這樣感人。
我上傳數(shù)據(jù)的時候心想,沒什么大不了的;我知道我住在哪;我知道我在哪上班;通過這個我能看到什么?
結(jié)果我看到了我來到紐約,走下飛機的那一刻,那一晚去吃泰餐的餐館,想象著紐約新生活的開始。我遇到女友的那一天,這是拉瓜迪亞機場,這是在阿姆斯特丹大道上的泰國餐廳,這是我遇到我女友的時候。
你們看到了嗎?我第一次講這些故事和我第二次講的時候,有什么區(qū)別?
我們不經(jīng)意間,把這些信息放在了人類語境中,通過把信息放在生活語境中,信息就產(chǎn)生了意義,這非常非常重要。
因為我們的歷史被保存在這些手機里,從這個角度來看這個人類語境的角度。
首先,我們可以更好理解我們,分享的是哪一類的信息,但如果我們可以把其他信息也放在人類語境中。我想很多事情都會被改變,因為它能自動讓在這些系統(tǒng)的人們身臨其境,這會導(dǎo)致最基本的尊重。
在我看來這一點在技術(shù)行業(yè)中往往是缺失的。當(dāng)我們在處理一些事情,比如隱私時,如果我們明白數(shù)字不僅僅是數(shù)字,而是與現(xiàn)實連接在一起的,它們就變得舉足輕重。有了這一層理解,對話就可以變得不同。
你們中多少人曾點過按鈕,許可第三方公司獲取你的定位信息的?很多人吧。第三方公司是開發(fā)商,第二方公司是蘋果,可是第一方卻從沒有獲得這些信息!
我想這是因為我們把這些信息看作是抽象的,可以被擱置不顧的,我們沒有把它們放入人類語境中,使它們的價值變得更重要。我請求你們做的事很簡單,從更人類語境的角度看待數(shù)據(jù),這真的不難。
當(dāng)你看到股價時,想一下背后的人類語境。當(dāng)你看到貸款報告時,想一下背后的人類語境。
很顯然,大數(shù)據(jù)是巨大的商業(yè)。一個產(chǎn)業(yè)巨頭在崛起,想一想我們在之前的資源產(chǎn)業(yè)中做得如何,我們做得不好。我想一部分問題在于,我們沒有積極參與到有關(guān)人文語境的各方面對話中。
我要請求你們做的另一件事是,讓更多人參與到這個對話中,藝術(shù)家、詩人、作家讓有人文學(xué)科背景的人們加入到討論中。
因為我相信數(shù)據(jù)世界可以革新我們的生活。這和我們在資源產(chǎn)業(yè)、金融產(chǎn)業(yè)的嘗試不同。讓我們把人文元素帶到故事中,我相信我們一定能帶著它走向無限潛能的地方。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03