
大腦袋需要大數(shù)據(jù)
全球各種大腦圖譜計劃正在展開,中國臺灣的計劃似乎有些小。當(dāng)?shù)乜茖W(xué)家正在研究果蠅,通過單個神經(jīng)元成像逆向編輯其大腦。他們的工作已經(jīng)以驚人詳細(xì)的程度制作了大腦電路的三維圖像。
研究人員僅需要一個計算機(jī)鼠標(biāo)和一個網(wǎng)頁瀏覽器就能追蹤單個細(xì)胞并將其縮放回神經(jīng)束交織的網(wǎng)絡(luò)中。這些布線圖看起來像掛毯上五顏六色的線,它們可以非常清晰地表明哪些細(xì)胞簇控制具體的行為。通過刺激具體的神經(jīng)線路,研究人員能夠提示一只果蠅拍打其左翅或是搖頭,這一技能去年11月在美國加州圣迭戈舉行的神經(jīng)科學(xué)年會上導(dǎo)致參會者整個下午特別激動。
但臺灣新竹清華大學(xué)神經(jīng)學(xué)家Ann-Shyn Chiang說,即便是對于這樣一個小生物,也耗費(fèi)了該團(tuán)隊(duì)整整十年以每個細(xì)胞10億字節(jié)的比率繪制6萬個神經(jīng)元。這甚至不足果蠅屬大腦神經(jīng)細(xì)胞的一半。若以此推算,利用同樣的方式繪制人腦中的860億個神經(jīng)元將要花費(fèi)1700萬年,Chiang在會議上報告說。
其他的技術(shù)更加易于處理。2016年7月,一個國際團(tuán)隊(duì)發(fā)表了人腦褶皺外層——大腦皮層的圖譜。很多科學(xué)家認(rèn)為這是到目前為止最詳細(xì)的人腦連接圖。然而,即便在其最高空間分辨率(1立方毫米),每個立體像素(三維物體最小的可分辨元素)均包含數(shù)千萬個神經(jīng)元。這與以單細(xì)胞繪制果蠅神經(jīng)元連接圖可謂差別懸殊。
所以,在神經(jīng)生物學(xué)的世界里,大數(shù)據(jù)確實(shí)是龐大的數(shù)據(jù)量。盡管計算機(jī)基礎(chǔ)設(shè)施和數(shù)據(jù)傳輸的進(jìn)步,“大數(shù)據(jù)”革命數(shù)十年前曾席卷基因組學(xué)領(lǐng)域,如今神經(jīng)科學(xué)家仍在努力應(yīng)對他們所在領(lǐng)域的新革命。
有多大
這一部分是因?yàn)闊o論是什么物種,大腦都如此巨大、關(guān)聯(lián)度如此之高。但它也來自于細(xì)胞難處理的維度。哺乳動物的神經(jīng)元主要延伸(即軸突)是其最小分支(樹突)長度和寬度的20萬倍。如果用意大利面代表樹突,那些神經(jīng)元自身就超過1公里的1/3,或是4個美式足球場。
在實(shí)驗(yàn)室中,研究人員通過成百上千個重疊的大腦切片圖像堆疊跟蹤其數(shù)千個投影,從而繪制每個神經(jīng)元。以光為基礎(chǔ)的顯微鏡能夠承載0.25~0.5微米的分辨率,這足以跟蹤一個神經(jīng)元的主體。但想要揭示突觸(通過電子或化學(xué)信號流的分鐘信號銜接點(diǎn)),納米成像電子顯微鏡是必需的。更高的像素意味著觀測領(lǐng)域更小和更多圖片。更多圖片意味著更多數(shù)據(jù)。
“我們不再是應(yīng)對百萬字節(jié),甚至是千兆字節(jié)。”洛杉磯南加州大學(xué)神經(jīng)成像實(shí)驗(yàn)室負(fù)責(zé)人Arthur Toga說,“我們應(yīng)對的是兆兆字節(jié)。將它從一個地方挪到另一個地方就是一個問題。”兩兆兆字節(jié)的數(shù)據(jù)將填滿很多臺式機(jī)的硬盤。
Chiang的果蠅團(tuán)隊(duì)對1兆兆字節(jié)的圖像進(jìn)行了梳理,以重建1000個神經(jīng)細(xì)胞——少于果蠅屬大腦的1%。HCP明尼波利斯明尼蘇達(dá)大學(xué)共同首席研究員Kamil Ugurbil說,為了繪制人類大腦皮層圖像,HCP研究人員分析了來自210名健康青年人的6兆兆字節(jié)的核磁共振(MRI)成像數(shù)據(jù)。實(shí)驗(yàn)室可以從該項(xiàng)目的網(wǎng)站或更大的數(shù)據(jù)集中下載那些數(shù)據(jù),每次下載那些8兆兆字節(jié)的文件需要花費(fèi)200美元。
電生理學(xué)研究在計算方面也變得更加吃力。今天,研究人員通常每次記錄數(shù)百個神經(jīng)元。很快,它將會達(dá)到數(shù)千個;在5年內(nèi),將達(dá)到成千上萬個,瑞士日內(nèi)瓦大學(xué)神經(jīng)學(xué)家Alexandre Pouget說?!斑@是我們將要發(fā)生的跳躍式前進(jìn)?!?
劍橋哈佛大學(xué)神經(jīng)學(xué)家Florian Engert說,如果你記錄小鼠大腦神經(jīng)元活動20分鐘,那么將會產(chǎn)生約500拍字節(jié)的“閃爍”,其中神經(jīng)細(xì)胞放電代表為像素值的變化。
神經(jīng)學(xué)家沒有可以對比的模型,沒有將神經(jīng)連接和活動行為、記憶或認(rèn)識相關(guān)連的地圖??紤]到大腦巨大的錯綜復(fù)雜性,馬里蘭州美國精神健康研究所負(fù)責(zé)人Greg Farber說,問題“并不在于我們有過多的數(shù)據(jù),而是我們遠(yuǎn)沒有達(dá)到需要解決這個復(fù)雜問題的數(shù)據(jù)”。
搭建橋梁
過去17年,鹽湖城猶他大學(xué)研究神經(jīng)發(fā)育紊亂的系統(tǒng)神經(jīng)學(xué)家Julie Korenberg和同事一直研究在恒河猴中繪制大腦邊緣系統(tǒng)。這種靈長類動物大腦有60億個神經(jīng)元,而人類大腦則有860億個。但在研究模型中,恒河猴與小鼠或果蠅相比同人類血緣關(guān)系最近。
Korenberg的團(tuán)隊(duì)正在開發(fā)一個三維協(xié)調(diào)模型,與恒河猴大腦中各種神經(jīng)成像數(shù)據(jù)相匹配,這些數(shù)據(jù)包括從整個大腦MRI連接到單細(xì)胞公焦數(shù)據(jù)以及一些區(qū)域的電子顯微鏡亞細(xì)胞分辨率。他們在建立“一個讓你在一個圖像上選擇一個點(diǎn)并以另一種分辨率來看這個點(diǎn)的系統(tǒng)”,國立精神衛(wèi)生研究所(NIMH)影響社會行為和社會認(rèn)知項(xiàng)目領(lǐng)頭人Janine Simmons說,該機(jī)構(gòu)為Korenberg的研究提供了部分支持。Simmons說,它有些類似谷歌地球,例如,你可以將焦距從40 ×直接轉(zhuǎn)變?yōu)? ×,但卻不能得到這些變焦尺度之間的層次。
利用20×共焦透鏡繪制恒河猴大腦邊緣系統(tǒng)圖像將需要巨大的數(shù)據(jù)集,每個動物遠(yuǎn)超過600兆兆字節(jié)。到目前為止,該團(tuán)隊(duì)已經(jīng)收集了約100兆兆字節(jié)的數(shù)據(jù)信息,可以通過30太字節(jié)的本地服務(wù)器與云端儲存連接的聯(lián)網(wǎng)儲存設(shè)備獲取。Korenberg說,研究人員可以用縮小尺寸的數(shù)據(jù)集和一臺性能良好的筆記本電腦解決一些問題。但操作大規(guī)模的三維共焦數(shù)據(jù)集需要特別的工作站,即便如此傳遞每個平鋪的圖片也很緩慢。
然而,這項(xiàng)尚待發(fā)表的研究“有可能成為連接這一領(lǐng)域最重要的進(jìn)展”。紐約市西奈山醫(yī)院神經(jīng)解剖學(xué)家Patrick Hof說,他曾與Korenberg合作過。例如,Korenberg說,這些數(shù)據(jù)可以幫助科學(xué)家將在特定神經(jīng)紊亂(如精神分裂癥和自閉癥)中看上去很重要的基因聯(lián)系起來,從而了解確切的大腦線路異常。
文化轉(zhuǎn)變
隨著科學(xué)家將可能的范圍向前推動,他們在建立一個計算通道以應(yīng)對日益加大的工作量,此外還在建立新的工具共享和可視化最終生成的數(shù)據(jù)。但緩解神經(jīng)科學(xué)家的數(shù)據(jù)問題,需要的不只是工具研發(fā),還需要文化轉(zhuǎn)變。很難讓人們“放開他們的數(shù)據(jù)”,加州斯坦福大學(xué)心理學(xué)家Russell Poldrack說,他用神經(jīng)成像研究學(xué)習(xí)和記憶。它可能會成為“一代人的事情”,他說,千禧一代人“比我們這一代人更喜歡共享編碼和數(shù)據(jù)”。Poldrack擔(dān)心,一流科學(xué)家可能會因?yàn)榭茖W(xué)“與他們認(rèn)為其應(yīng)該具有的價值不匹配”而沮喪,并離開這個領(lǐng)域。
但態(tài)度在逐漸轉(zhuǎn)變,首先是那些針對軟件的,其次是數(shù)據(jù)。傳統(tǒng)上,神經(jīng)成像實(shí)驗(yàn)室會花費(fèi)大量時間下載和裝載同樣的β測試軟件?!盀楦鞣N軟件失靈和計算瓶頸開路,編寫大量累贅的編碼以及進(jìn)行他們自己的數(shù)據(jù)管理解決方案,以處理同樣的問題”。加州大學(xué)戴維斯分校神經(jīng)科學(xué)博士生David Grayson說。更糟糕的是,很多非研究性任務(wù)被委托給學(xué)生、博士后和年輕科學(xué)家。
傳統(tǒng)的學(xué)術(shù)模式對此沒有幫助。研究人員通常會設(shè)置假設(shè),并在其團(tuán)隊(duì)內(nèi)獨(dú)立地考慮自己的想法。在這樣的環(huán)境中,研究并未把人帶到一起,而是將他們分散開來,華盛頓西雅圖艾倫腦科學(xué)研究所的Hongkui Zeng說?!澳阈枰屪约翰煌P枰谠擃I(lǐng)域建立自己的身份,你需要做一些與他人不同的事情?!?
在談到大腦研究時,“完成”是個移動性的目標(biāo)。對于神經(jīng)科學(xué)工具包來說也是如此。在神經(jīng)科學(xué)學(xué)會年會的講話中,Chiang感嘆繪制一只果蠅大腦的一半圖譜居然花費(fèi)了10年。他們與中國臺灣的物理學(xué)家合作,正開始利用一種叫作同步加速器X射線斷層掃描的技術(shù)大幅提高數(shù)據(jù)認(rèn)知?!八鼉H需要不到10分鐘就繪制一只果蠅的大腦圖像,其中包含數(shù)千個高爾基染色單個神經(jīng)元?!盋hiang說,他的團(tuán)隊(duì)正在小鼠和豬身上嘗試該方法。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03