
生命大數(shù)據(jù)將進(jìn)入尋常百姓生活
人的一生,簡(jiǎn)單的講,不外乎“生老病死”。我們能抗?fàn)幍?、個(gè)體差異最大的就是“病”了。幾千年文化、知識(shí)、技術(shù)、經(jīng)驗(yàn)的累積,人類(lèi)對(duì)自身健康狀況的了解以及疾病干預(yù)的能力都大大提高。然而,我們對(duì)自身健康的掌控能力離預(yù)期還遠(yuǎn)遠(yuǎn)不夠,面對(duì)各類(lèi)疾病缺少深入的了解、精細(xì)的分類(lèi)和有針對(duì)性的治療。
旨在正確的時(shí)間,給正確的人,使用正確的藥物的“精準(zhǔn)醫(yī)療”應(yīng)運(yùn)而生。獲取和掌握組學(xué)、臨床信息等生命大數(shù)據(jù)里包含的海量信息是醫(yī)療邁向精準(zhǔn)的重要前提。生命大數(shù)據(jù)的累積和挖掘?qū)⒅鸩浇沂窘】蹬c疾病的全景關(guān)聯(lián)圖。
生命大數(shù)據(jù)支撐精準(zhǔn)醫(yī)學(xué)研究
人類(lèi)基因組計(jì)劃(human genome project,HGP)、基因組單體型圖計(jì)劃(hapmapproject)、全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)、DNA元件百科全書(shū)(encyclopedia of DNA elements,ENCODE)、表觀路線圖(NIH roadmap epigenomics)等大型組學(xué)計(jì)劃的順利完成,帶動(dòng)了生命科學(xué)領(lǐng)域的重大變革。
高通量測(cè)序、高性能質(zhì)譜等組學(xué)技術(shù)得以快速發(fā)展,生命科學(xué)研究產(chǎn)生了大量有價(jià)值的包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等在內(nèi)的“生物大數(shù)據(jù)”。整合分析多重組學(xué)數(shù)據(jù)和臨床資料,構(gòu)建健康與疾病的知識(shí)網(wǎng)絡(luò),將有望對(duì)疾病發(fā)展和不同病理狀態(tài)進(jìn)行更加準(zhǔn)確的分類(lèi),為不同遺傳背景的患者提供個(gè)體化診斷及精準(zhǔn)治療。
很顯然,科學(xué)家們都已經(jīng)意識(shí)到各類(lèi)生命大數(shù)據(jù)的重要作用。然而,以上重要的大型組學(xué)計(jì)劃均由歐美國(guó)家發(fā)起,獲得的數(shù)據(jù)主要基于歐美人群。中國(guó)人口眾多,遺傳背景與歐美人群有較大差異。實(shí)現(xiàn)中國(guó)人民的精準(zhǔn)醫(yī)療,則需要中國(guó)人群的生命大數(shù)據(jù)來(lái)推動(dòng)。
中科院在2015年啟動(dòng)重點(diǎn)部署項(xiàng)目“中國(guó)人群精準(zhǔn)醫(yī)學(xué)研究計(jì)劃”,將在4年內(nèi)完成4000名志愿者的DNA樣本和多種表現(xiàn)型數(shù)據(jù)的采集,并對(duì)其中2000人進(jìn)行深入的精準(zhǔn)醫(yī)學(xué)研究,包括全基因組序列分析,建立基因組健康檔案,針對(duì)一些重要慢性病的遺傳信號(hào)開(kāi)展疾病風(fēng)險(xiǎn)和藥物反應(yīng)的預(yù)警和干預(yù)研究。這些數(shù)據(jù)將會(huì)成為非常寶貴的中國(guó)人群遺傳信息資源。
科技部于2016年3月8日公布《關(guān)于發(fā)布國(guó)家重點(diǎn)研發(fā)計(jì)劃精準(zhǔn)醫(yī)學(xué)研究等重點(diǎn)專(zhuān)項(xiàng)2016年度項(xiàng)目申報(bào)指南的通知》,拉開(kāi)了精準(zhǔn)醫(yī)療重大專(zhuān)項(xiàng)科研行動(dòng)的序幕。本年度的科研專(zhuān)項(xiàng)包括構(gòu)建百萬(wàn)人以上的自然人群國(guó)家大型健康隊(duì)列和重大疾病專(zhuān)病隊(duì)列,建立生物醫(yī)學(xué)大數(shù)據(jù)共享平臺(tái)等。
在國(guó)家戰(zhàn)略需求層面,生命大數(shù)據(jù)研究正如火如荼的開(kāi)展起來(lái),為精準(zhǔn)醫(yī)學(xué)研究打下基礎(chǔ)。這一系列大數(shù)據(jù)項(xiàng)目的開(kāi)展,將建設(shè)一套符合我國(guó)國(guó)情的生命大數(shù)據(jù)的獲取、分析、存儲(chǔ)、使用等規(guī)范;多個(gè)與健康相關(guān)的中國(guó)人群生命大數(shù)據(jù)知識(shí)庫(kù);面向科研人員和醫(yī)務(wù)工作者的友好共享數(shù)據(jù)平臺(tái)等等?;谶@些大數(shù)據(jù)挖掘生命動(dòng)態(tài)規(guī)律,將是通向精準(zhǔn)醫(yī)療的重要基石。
綜合組學(xué)大數(shù)據(jù)和臨床大數(shù)據(jù)挖掘生命規(guī)律
生命大數(shù)據(jù)包含的種類(lèi)繁多,包括基因組、轉(zhuǎn)錄組、蛋白組、表觀組、宏基因組等各類(lèi)組學(xué)數(shù)據(jù)和影像、生化指標(biāo)、標(biāo)型特征等各類(lèi)臨床數(shù)據(jù)。我國(guó)各類(lèi)組學(xué)數(shù)據(jù)主要產(chǎn)生于科研院所和高校,臨床數(shù)據(jù)主要來(lái)源于各類(lèi)醫(yī)療機(jī)構(gòu)。
整合多類(lèi)數(shù)據(jù),挖掘深層機(jī)制無(wú)疑是行之有效的方法。過(guò)去的整合分析主要是限于各類(lèi)組學(xué)數(shù)據(jù)內(nèi)部,例如綜合組蛋白修飾數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)和染色質(zhì)相互作用數(shù)據(jù)篩查全基因組范圍內(nèi)的順式作用元件。當(dāng)面對(duì)精準(zhǔn)醫(yī)療,需要明確疾病的不同亞型及對(duì)應(yīng)的分子機(jī)制,以及合適的治療方案,大數(shù)據(jù)在整合分析、挖掘時(shí)則必須要加上臨床大數(shù)據(jù)。
在2016年,多家科研機(jī)構(gòu)和醫(yī)療機(jī)構(gòu)聯(lián)合起來(lái),共同攻關(guān)生命大數(shù)據(jù):
中科院北京基因組研究所聯(lián)合中科院生物物理研究所、浙江大學(xué)、復(fù)旦大學(xué)、國(guó)家衛(wèi)計(jì)委信息統(tǒng)計(jì)中心、北大人民醫(yī)院、中南大學(xué)湘雅醫(yī)院系統(tǒng)等構(gòu)建精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)處理和利用的標(biāo)準(zhǔn)化技術(shù)體系。
軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所聯(lián)合多家機(jī)構(gòu)構(gòu)建精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)管理和共享技術(shù)平臺(tái)。
少量生命大數(shù)據(jù)的研究成果已經(jīng)進(jìn)入普通百姓的視野
在媒體的大力宣傳下,大數(shù)據(jù)和精準(zhǔn)醫(yī)療的概念已出現(xiàn)在普通百姓的生活中。一些基于生命大數(shù)據(jù)的成果已經(jīng)被用到普通消費(fèi)者身上,最為常見(jiàn)的就是基因檢測(cè)了。
通過(guò)對(duì)具有特定特征(如患某種疾病)的人群和對(duì)照人群進(jìn)行遺傳物質(zhì)的對(duì)比和關(guān)聯(lián)研究,可挖掘出一些與該特征相關(guān)的基因位點(diǎn)。一些商業(yè)公司將同類(lèi)疾病的不同研究結(jié)果綜合起來(lái),評(píng)估消費(fèi)者患某類(lèi)疾病的風(fēng)險(xiǎn)。這被認(rèn)為是一個(gè)很酷、有用、擁有巨大商業(yè)前景的行業(yè),因此近一兩年內(nèi)成立了許多面向普通消費(fèi)者的基因檢測(cè)公司。
“十三五”期間的生命大數(shù)據(jù)
我國(guó)的精準(zhǔn)醫(yī)療從今年開(kāi)始落地實(shí)施,研究?jī)?nèi)容涉及到大規(guī)模人群隊(duì)列研究和精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)研究??梢灶A(yù)見(jiàn),在三到五年內(nèi),將會(huì)產(chǎn)生大量中國(guó)人群的各類(lèi)生命大數(shù)據(jù)以及對(duì)應(yīng)的知識(shí)注釋。
一方面,這些大數(shù)據(jù)將有望打破歐美國(guó)家對(duì)生命大數(shù)據(jù)的壟斷,形成世界范圍內(nèi)的新布局;同時(shí),將有力推動(dòng)我國(guó)生命科學(xué)研究和健康事業(yè);此外,階段性的成果也可能會(huì)被單獨(dú)拿出來(lái),直接走向面對(duì)普通消費(fèi)者的商業(yè)模式中(就像基因檢測(cè)一樣)。
伴隨著美好愿景的,也一定還有潛在問(wèn)題:
1、我國(guó)還缺乏一個(gè)國(guó)家級(jí)的、被廣大科研人員認(rèn)可的數(shù)據(jù)存儲(chǔ)、使用、共享平臺(tái);
2、大數(shù)據(jù)的安全與管理也是重中之重;
3、各類(lèi)公司帶著一些成果直接面向普通消費(fèi)者,但缺乏統(tǒng)一、可用的行業(yè)標(biāo)準(zhǔn),不當(dāng)?shù)幕蚪庾x有可能傷害一些消費(fèi)者,造成普通百姓對(duì)大數(shù)據(jù)行業(yè)的誤解。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10