
大數(shù)據(jù)引導(dǎo)生物醫(yī)學(xué)變革
大數(shù)據(jù)影響的深度和廣度仍在不斷擴(kuò)張。對(duì)于生物醫(yī)學(xué)來(lái)說(shuō),其發(fā)展過(guò)程中積淀的數(shù)據(jù)資源,是大數(shù)據(jù)時(shí)代的基礎(chǔ)之一。而大數(shù)據(jù)的挖掘和應(yīng)用,反過(guò)來(lái)也在引發(fā)著生物醫(yī)學(xué)的變革。
在此次論壇上,專家們圍繞“大數(shù)據(jù)在醫(yī)學(xué)科技創(chuàng)新中的應(yīng)用”這一話題,進(jìn)行了深入的交流探討。與會(huì)專家指出,生物大數(shù)據(jù)已經(jīng)成為歐美國(guó)家重要的發(fā)展戰(zhàn)略,而我國(guó)生物醫(yī)學(xué)大數(shù)據(jù)開(kāi)發(fā)同發(fā)達(dá)國(guó)家尚有一定差距,亟須加強(qiáng)相關(guān)研究和投入。
大數(shù)據(jù)引發(fā)醫(yī)學(xué)研究變革
“大數(shù)據(jù)是大趨勢(shì),使得生產(chǎn)資料中首次出現(xiàn)了非物質(zhì)成分:數(shù)據(jù)。世界正在由資本經(jīng)濟(jì)時(shí)代向數(shù)據(jù)經(jīng)濟(jì)時(shí)代過(guò)渡,數(shù)據(jù)及其服務(wù)成為國(guó)家戰(zhàn)略和經(jīng)濟(jì)的基礎(chǔ)設(shè)施?!避娛箩t(yī)學(xué)科學(xué)院研究員朱云平長(zhǎng)期從事生物信息學(xué)綜合數(shù)據(jù)庫(kù)及平臺(tái)建設(shè)研究,在他看來(lái),生物和醫(yī)療領(lǐng)域已成為重要的大數(shù)據(jù)領(lǐng)域。
中國(guó)工程院院士、中日友好醫(yī)院院長(zhǎng)王辰指出,大數(shù)據(jù)時(shí)代的來(lái)臨,加上轉(zhuǎn)化醫(yī)學(xué)的興起,在我國(guó)形成了歷史性契機(jī),可望使中國(guó)醫(yī)學(xué)研究實(shí)現(xiàn)歷史性跨越。
首都醫(yī)科大學(xué)附屬北京安貞醫(yī)院心臟內(nèi)科中心主任馬長(zhǎng)生正在承擔(dān)“北京市心血管疾病防控大數(shù)據(jù)平臺(tái)建設(shè)”的工作,在他的研究中,包括用大數(shù)據(jù)手段研究環(huán)境和心血管疾病的關(guān)系?!坝么髷?shù)據(jù)的手段,每日不同站點(diǎn)PM2.5濃度與心血管疾病的關(guān)系,甚至股票波動(dòng)與心血管疾病的關(guān)系,都可以得到預(yù)測(cè)?!?
“美國(guó)發(fā)布的年度癌腫報(bào)告,其實(shí)是一份惡性腫瘤大數(shù)據(jù)分析報(bào)告?!敝袊?guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院副院長(zhǎng)王綠化介紹,中國(guó)正在建設(shè)腦腫瘤大數(shù)據(jù)平臺(tái),旨在提供數(shù)據(jù)樣本資源庫(kù),同時(shí)為八大腫瘤建立知識(shí)庫(kù)和分析庫(kù)。
而事實(shí)上,大數(shù)據(jù)不僅為生物醫(yī)學(xué)研究帶來(lái)了新的技術(shù)手段,還具有大規(guī)模降低醫(yī)療費(fèi)用的潛在效益。根據(jù)美國(guó)BCC research公司研究顯示,僅就與高通量測(cè)序相關(guān)的組學(xué)大數(shù)據(jù)而言,至2018年,其市場(chǎng)總額將增長(zhǎng)至76億美元,復(fù)合年增長(zhǎng)率達(dá)到71%。麥肯錫全球研究院報(bào)告,如果美國(guó)醫(yī)療保健行業(yè)對(duì)大數(shù)據(jù)進(jìn)行有效利用,就能把成本降低8%左右,從而每年創(chuàng)造出超過(guò)3000億美元的產(chǎn)值。
發(fā)達(dá)國(guó)家經(jīng)驗(yàn)與挑戰(zhàn)
大數(shù)據(jù)科學(xué)與產(chǎn)業(yè)具有較強(qiáng)的領(lǐng)域相關(guān)性,生物大數(shù)據(jù)已經(jīng)成為歐美國(guó)家重要的發(fā)展戰(zhàn)略,也是美國(guó)國(guó)家大數(shù)據(jù)計(jì)劃的重要組成部分。
朱云平介紹,歐美主導(dǎo)的國(guó)際生命科學(xué)計(jì)劃產(chǎn)生的數(shù)據(jù)和知識(shí),已成為重要的國(guó)家資源。例如國(guó)際人類基因組單體型圖計(jì)劃、DNA元件百科全書(shū)計(jì)劃、人類表觀基因組計(jì)劃、國(guó)際癌基因組計(jì)劃、千人基因組計(jì)劃等,這些計(jì)劃形成的數(shù)據(jù)資源潛在價(jià)值十分巨大。
2009年,美國(guó)出臺(tái)HITECH法案,將醫(yī)療衛(wèi)生信息化列為重點(diǎn)發(fā)展方向,十年內(nèi)累計(jì)投入2760億美元。加拿大也在規(guī)劃EHRS藍(lán)圖,旨在全面推進(jìn)國(guó)家醫(yī)療信息化、電子監(jiān)控檔案建設(shè)。英國(guó)10年內(nèi)投入超過(guò)120億英鎊,用于建設(shè)全國(guó)一體化的醫(yī)療信息系統(tǒng)。歐盟則發(fā)力統(tǒng)一的e-health體系建設(shè),10年投入超過(guò)60億歐元。
但在我國(guó),卻存在缺失生物數(shù)字主權(quán)的尷尬。近年來(lái)中國(guó)學(xué)者在國(guó)外發(fā)表了眾多學(xué)術(shù)論文,在發(fā)文章時(shí),需要先把數(shù)據(jù)傳輸給國(guó)外雜志社?!霸趪?guó)外發(fā)表文章后,名義上是說(shuō)可以獲得數(shù)據(jù)共享,但中國(guó)學(xué)者需要的許多數(shù)據(jù)并不是想拿就能拿到的?!敝煸破秸f(shuō)。
朱云平指出,我國(guó)醫(yī)療數(shù)據(jù)幾乎不能共享,轉(zhuǎn)化利用率低。而美國(guó)目前已經(jīng)初步實(shí)現(xiàn)了社區(qū)、醫(yī)院、區(qū)域的醫(yī)療數(shù)據(jù)共享系統(tǒng)?,F(xiàn)實(shí)導(dǎo)致我國(guó)缺少自主知識(shí)產(chǎn)權(quán)的高價(jià)值生物數(shù)據(jù)庫(kù),且我國(guó)生物大數(shù)據(jù)分析能力嚴(yán)重不足。
這使得中國(guó)學(xué)者在使用國(guó)外數(shù)據(jù)時(shí),必須支付高昂的費(fèi)用。例如,世界最為權(quán)威的代謝通路數(shù)據(jù)庫(kù)KEGG,其使用費(fèi)為每年5000美元。權(quán)威的人類疾病相關(guān)變異數(shù)據(jù)庫(kù)HGMD,其年費(fèi)是3725美元。權(quán)威的藥物基因組變異與藥物反應(yīng)數(shù)據(jù)庫(kù)PGMD,其年費(fèi)也達(dá)3735美元。
生物大數(shù)據(jù)事關(guān)國(guó)家未來(lái)戰(zhàn)略
去年9月谷歌公司宣布成立Calico公司,利用大數(shù)據(jù)進(jìn)行人類衰老及相關(guān)疾病方面的研究。亞馬遜通過(guò)其云平臺(tái)托管?chē)?guó)際千人基因組計(jì)劃龐大數(shù)據(jù)庫(kù),并免費(fèi)開(kāi)放。微軟也啟動(dòng)了microsoft biology initiative項(xiàng)目,進(jìn)軍生物醫(yī)學(xué)大數(shù)據(jù)領(lǐng)域。據(jù)悉,美國(guó)已建成覆蓋本土的12個(gè)區(qū)域電子病歷數(shù)據(jù)中心、9個(gè)醫(yī)療知識(shí)中心和8個(gè)醫(yī)學(xué)影像與生物信息數(shù)據(jù)中心。
但是,我國(guó)生物醫(yī)學(xué)大數(shù)據(jù)產(chǎn)業(yè)尚未形成。朱云平說(shuō),我國(guó)迫切需要建立國(guó)家級(jí)生物大數(shù)據(jù)技術(shù)研發(fā)基地。
所幸的是,國(guó)家“863”計(jì)劃2015年度項(xiàng)目申報(bào)指南中,在生物和醫(yī)藥技術(shù)領(lǐng)域已經(jīng)部署“生物大數(shù)據(jù)開(kāi)發(fā)與利用關(guān)鍵技術(shù)研究”,涉及的內(nèi)容包括生物大數(shù)據(jù)標(biāo)準(zhǔn)化和集成、融合技術(shù),生物大數(shù)據(jù)表述索引、搜索與存儲(chǔ)訪問(wèn)技術(shù),心血管疾病和腫瘤疾病大數(shù)據(jù)處理分析與應(yīng)用研究,機(jī)遇區(qū)域醫(yī)療與健康大數(shù)據(jù)處理分析與應(yīng)用研究,組學(xué)大數(shù)據(jù)中心和知識(shí)庫(kù)構(gòu)建與服務(wù)技術(shù)等。
“生物醫(yī)學(xué)大數(shù)據(jù)開(kāi)發(fā)與利用,應(yīng)面向我國(guó)生物數(shù)據(jù)匯集、管理、共享與利用的重大需求,重點(diǎn)突破生物大數(shù)據(jù)質(zhì)量控制、集成融合、索引組織、存儲(chǔ)管理、搜索訪問(wèn)、數(shù)據(jù)可視化、分析建模、知識(shí)庫(kù)構(gòu)建等關(guān)鍵技術(shù)。”朱云平建議。
加強(qiáng)專業(yè)人才培養(yǎng)也尤為迫切。王辰指出,為適應(yīng)生物醫(yī)學(xué)大數(shù)據(jù)的發(fā)展,應(yīng)在生物醫(yī)學(xué)領(lǐng)域加強(qiáng)計(jì)算機(jī)科學(xué)、數(shù)據(jù)庫(kù)專業(yè)人員的培養(yǎng),加強(qiáng)流行病學(xué)、統(tǒng)計(jì)分析、信息學(xué)人員、標(biāo)本庫(kù)管理人員的培養(yǎng)。
不過(guò),生物醫(yī)學(xué)大數(shù)據(jù)也存在一定的風(fēng)險(xiǎn)。大數(shù)據(jù)中心的可靠性和隱私保護(hù)是其中的關(guān)鍵。
“數(shù)據(jù)中心崩潰的風(fēng)險(xiǎn),可以通過(guò)在不同地域、不同條件下進(jìn)行生物大數(shù)據(jù)存儲(chǔ),再進(jìn)行協(xié)同整合來(lái)解決。但在生物大數(shù)據(jù)的分析應(yīng)用中,需要收集一切已知的生物信息,這與隱私保護(hù)存在沖突?!敝煸破秸J(rèn)為,如何在應(yīng)用生物大數(shù)據(jù)的同時(shí),更好地保護(hù)個(gè)人隱私信息,需要深入研究。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03