
大數(shù)據(jù)是否會(huì)讓我們未來(lái)的醫(yī)療資源不再緊張
前不久,一定有很多人追蹤過(guò)美國(guó)大選,這次大選的結(jié)果讓人跌破眼鏡,因?yàn)樗忻襟w在選前都認(rèn)為希拉里會(huì)贏,都認(rèn)為特朗普是弱勢(shì)的一方,但結(jié)果卻是迥然不同的。
其實(shí)早在三個(gè)月前,我們中國(guó)人手里就已經(jīng)有了一些能夠預(yù)示這個(gè)結(jié)果的數(shù)據(jù)。
阿里巴巴在大選前對(duì)美國(guó)總統(tǒng)候選人各自的粉絲購(gòu)買(mǎi)的宣傳品做了比較,紅線就是特朗普的,他的粉絲買(mǎi)了帽子、面具、標(biāo)語(yǔ)等等;藍(lán)色的是希拉里,你會(huì)發(fā)現(xiàn)兩組支持者的熱情是不一樣的。
在這屆的美國(guó)大選中,只有55%的合法選民去投票,特朗普獲勝的關(guān)鍵因素就是,支持他的人比支持希拉里的人更狂熱,他們都去投票了。
阿里巴巴的數(shù)據(jù)在三個(gè)月之前就能看出端倪,最后果然是特朗普贏了,所以數(shù)據(jù)能告訴我們很多智慧。當(dāng)今數(shù)據(jù)的量已經(jīng)非常龐大,要按字節(jié)算的話,它已經(jīng)超過(guò)了太陽(yáng)系所有原子數(shù)目的總和,如果我們能夠把這些大數(shù)據(jù)很好地運(yùn)用起來(lái),就能給我們非常多新的信息和知識(shí)。
這一張圖是我們中國(guó)的數(shù)據(jù),右邊是百度地圖顯示的最近某年春運(yùn)期間的人口遷徙方向,左邊是該年春運(yùn)第一天,十大人口遷出城市和十大人口遷入城市。
只要看到這個(gè),我們很快就能理解為什么三四線城市的房?jī)r(jià)支撐力比一線城市弱得多,我們知道,人口總是從三四線城市流向一線城市,因此北上廣這些地方房?jī)r(jià)的指數(shù)一定是很高的。
我們的主觀感知往往與大數(shù)據(jù)結(jié)論相悖
我們很多主觀感覺(jué)和個(gè)人想象,往往和大數(shù)據(jù)的結(jié)果是不相符的。
在我出國(guó)之前,印象中一直覺(jué)得我們國(guó)家是貧窮的,我們的生活質(zhì)量、健康指數(shù)比發(fā)達(dá)國(guó)家落后。但是這張圖告訴我們,事實(shí)并非如此。
這是由一位美國(guó)科學(xué)家把很多個(gè)國(guó)家的人均收入和平均壽命從1800年起進(jìn)行對(duì)比,而后畫(huà)出來(lái)的圖像。這上面每一個(gè)圓點(diǎn)對(duì)應(yīng)一個(gè)國(guó)家一年的平均國(guó)民收入和平均壽命,黃色的點(diǎn)代表美國(guó),紅色的點(diǎn)代表中國(guó)。美國(guó)的數(shù)據(jù)從1802年開(kāi)始,實(shí)際上美國(guó)的起點(diǎn)和中國(guó)人是很像的,它有很多年是停滯發(fā)展的,從這張圖可以看到,在它的國(guó)民收入不停增長(zhǎng)的同時(shí),它的國(guó)民平均壽命,并沒(méi)有什么太大變化,它一直是平的。
而中國(guó)則不一樣,中國(guó)是因?yàn)?800年之后,有過(guò)很多災(zāi)難和戰(zhàn)爭(zhēng),所以在將近100年的時(shí)間,中國(guó)的紅點(diǎn)一直就在左下角徘徊,國(guó)民收入和人均壽命一直有波動(dòng)。
但是從1949年以后,雖然中國(guó)還沒(méi)有富起來(lái),但由于有了相對(duì)規(guī)范的社會(huì)管理和一些衛(wèi)生政策的實(shí)施,我們國(guó)民的平均壽命開(kāi)始有了飛躍式增長(zhǎng)。實(shí)際上它很快和發(fā)達(dá)國(guó)家的平均壽命持平,達(dá)到了65~70歲。一直到改革開(kāi)放之后,這個(gè)紅點(diǎn)開(kāi)始向右移動(dòng),那就說(shuō)明中國(guó)人在健康之后,又富了起來(lái)。
這些數(shù)據(jù)如果不畫(huà)出來(lái),也許我們對(duì)歷史的解讀會(huì)有一個(gè)不同的結(jié)論。
非醫(yī)學(xué)專業(yè)的人,也能通過(guò)大數(shù)據(jù)幫助人類健康
那么大數(shù)據(jù)能夠?yàn)槲覀兊尼t(yī)療和健康做什么事情呢?
它可以拯救生命。1854年,倫敦曾經(jīng)有過(guò)霍亂的大爆發(fā),當(dāng)時(shí)每年有兩萬(wàn)三千多人因此喪生。沒(méi)有人能知道為什么,因?yàn)楫?dāng)初顯微鏡看不到病原體,很多醫(yī)療技術(shù)還沒(méi)有被發(fā)明。在這種情況下,倫敦開(kāi)始研發(fā)它的大數(shù)據(jù)。
他們做的一件事情就是統(tǒng)計(jì)倫敦市民的死亡數(shù)據(jù),每個(gè)街道每戶人家,哪一年死了什么人,都登記下來(lái)。有一個(gè)非常勤奮的衛(wèi)生官員,還把倫敦地圖畫(huà)出來(lái),并且根據(jù)這個(gè)倫敦市民死亡數(shù)據(jù)去調(diào)查死者的年紀(jì)和死因,并統(tǒng)計(jì)了霍亂的死亡癥狀和數(shù)據(jù),把霍亂在倫敦?cái)U(kuò)散的情況和地圖做了對(duì)比,就是右邊這個(gè)圖。
他很快就找到了霍亂的傳染源,雖然傳染源的水也看不出有任何污染,倫敦政府的官員將信將疑,但還是關(guān)閉了這個(gè)水源。關(guān)掉之后的第二年,倫敦霍亂死亡人數(shù)大大下降。
這個(gè)數(shù)據(jù)分析,拯救了成千上萬(wàn)個(gè)人,這就是大數(shù)據(jù)對(duì)我們的神奇作用。
下面這個(gè)是現(xiàn)代版的大數(shù)據(jù)研究,根據(jù)美國(guó)幾百萬(wàn)人的電子病歷做出的分析。
左邊記錄了所有人的疾病,如果一個(gè)病人又有疾病a,又有疾病b,就在a和b之間連一條曲線,你就看到有些疾病互相關(guān)聯(lián)得比較緊密,有一些疾病沒(méi)有什么關(guān)聯(lián);通過(guò)這些數(shù)據(jù),整合成右邊的疾病網(wǎng)絡(luò),我們可以看到人是怎么樣產(chǎn)生疾病或傳染疾病的。比如背部的肌肉疼痛,可能會(huì)有的并發(fā)癥。
這些圖是由像我這樣并沒(méi)有受過(guò)醫(yī)學(xué)訓(xùn)練的人畫(huà)出來(lái)的,我也并不懂醫(yī)學(xué)的原理,但是因?yàn)槲覀冇辛顺鞘腥巳旱尼t(yī)療數(shù)據(jù),我們就能知道很多病之間是有關(guān)聯(lián)的,我們治病a的時(shí)候,可能要考慮病b,不能頭疼醫(yī)頭腳疼醫(yī)腳,而應(yīng)該是系統(tǒng)性地進(jìn)行治療。
因此這就是現(xiàn)代數(shù)據(jù)對(duì)人們健康生活的一個(gè)重要指導(dǎo)作用。那么大數(shù)據(jù)對(duì)我們城市健康還有什么深刻的影響呢?
大家都很關(guān)心PM2.5,這是紐約市對(duì)空氣污染和人口晝夜分布做出的分析。
他們?cè)诔鞘欣锏教幉贾脗鞲衅?,測(cè)量不同位置PM2.5的濃度,然后畫(huà)出來(lái)它的分布情況。深紅色就是PM2.5比較高的地方,也就是說(shuō)曼哈頓的下端和布魯克林的上端污染最嚴(yán)重。但這里并沒(méi)有告訴它對(duì)人口的影響。
下面是麻省理工學(xué)院一個(gè)研究團(tuán)隊(duì),把這些數(shù)據(jù)和其它不同數(shù)據(jù)聯(lián)合起來(lái)做出的分析。
左邊是紐約市人口居住密度的數(shù)據(jù),深綠色表示居住人口比較多;右邊通過(guò)美國(guó)移動(dòng)手機(jī)的位置數(shù)據(jù)分析紐約市晝夜人口分布差異,我們可以看到白天人口集中在曼哈頓的下端和布魯克林的上端。
把這兩方面的數(shù)據(jù)和PM2.5的監(jiān)測(cè)數(shù)據(jù)放到一起,可以得出不同時(shí)間霧霾對(duì)人的影響。
現(xiàn)有的宮頸癌防治方案都是由西方制定的
中國(guó)人需要自己的大數(shù)據(jù)研發(fā)精準(zhǔn)醫(yī)療
我們可以利用大數(shù)據(jù)做到精準(zhǔn)醫(yī)療。
什么叫精準(zhǔn)醫(yī)療?就是在制定預(yù)防措施和治療方案的時(shí)候,把人的基因、生活環(huán)境和生活習(xí)慣等因素考量進(jìn)去,使得治療手段更有效率、更健康,這就叫精準(zhǔn)醫(yī)療,精準(zhǔn)醫(yī)療是離不開(kāi)精準(zhǔn)數(shù)據(jù)的。
我們的團(tuán)隊(duì)現(xiàn)在擁有中國(guó)2300多項(xiàng)醫(yī)學(xué)檢驗(yàn)的海量數(shù)據(jù),每年處理的標(biāo)本量超過(guò)了四千萬(wàn)例,覆蓋了全國(guó)98%的人口、所有的民族,所有的年齡層次以及性別。
其中一項(xiàng)是宮頸癌篩查。在過(guò)去幾年當(dāng)中,我們?yōu)?7個(gè)省市,大概1600多萬(wàn)人做了宮頸癌的篩查,之后我們從數(shù)據(jù)中獲得了很多以前我們不知道的信息。
一個(gè)是,我們找到了針對(duì)中國(guó)人口漏檢率最低的檢測(cè)方式。
左邊我們看到用細(xì)胞學(xué)檢測(cè)方式會(huì)有百分之一點(diǎn)幾的漏檢率,右邊病毒學(xué)的檢測(cè)方式,漏檢率就更高,百分之八九左右。
但是如果我們團(tuán)隊(duì)把兩種檢測(cè)結(jié)合起來(lái)一起做,漏檢率可以降低到0.6%,數(shù)據(jù)更加準(zhǔn)確了,結(jié)果就更好了。
其次,我們發(fā)現(xiàn)宮頸癌的感染病毒HPV的100多種型別中,中國(guó)人群感染率最高的型別是52型,16型,58型,這和全球HPV數(shù)據(jù)中心報(bào)道的感染率最高的16和18型不同。
但是,目前宮頸癌的預(yù)防、宮頸癌的篩查和患者管理指南主要是基于HPV16/18型等高危型HPV設(shè)計(jì)和制定的,我國(guó)并沒(méi)有自己獨(dú)特的預(yù)防、篩查和患者管理方案,這值得我們重視和思考。
有了中國(guó)人口的大數(shù)據(jù),我們就能夠幫助我們中國(guó)人開(kāi)發(fā)有助于自己特點(diǎn)的,更優(yōu)化的醫(yī)療手段和藥物,并且,大數(shù)據(jù)也使預(yù)防成為可能。
為什么將來(lái)我們不再需要那么多醫(yī)院?
想要在一個(gè)人得病之前就知道他將來(lái)要得什么病,這是很難的一個(gè)事情,如果沒(méi)有數(shù)據(jù),基本上是不可能的。
但是現(xiàn)在我們的技術(shù)手段和工作方式已經(jīng)與以前非常不同了,比如說(shuō)一個(gè)嬰兒從出生那一刻就開(kāi)始產(chǎn)生大量的數(shù)據(jù),我們把它成長(zhǎng)的每個(gè)階段的數(shù)據(jù)都記錄、保存起來(lái),于是后面就能夠在人的任何方面,進(jìn)行數(shù)據(jù)的挖掘和分析。
比如說(shuō)我們?nèi)チ酸t(yī)院,留下了電子病歷;我們?nèi)チ顺?,我們留下了?gòu)買(mǎi)食物的證據(jù);我們?nèi)チ嗽\所跟醫(yī)生談過(guò),那么醫(yī)生給了我們什么建議;我們?cè)趯W(xué)校做了什么、我們的生活習(xí)慣是什么、我們抽不抽煙……這些數(shù)據(jù)都可以量化,都可以在城市內(nèi)對(duì)大范圍的人群進(jìn)行量化。
那么,我們未來(lái)的醫(yī)療就已經(jīng)不是簡(jiǎn)單的住不住院的問(wèn)題,去不去急診的問(wèn)題,它會(huì)包含日常保健、疾病預(yù)防、急性病和慢性病的管理,甚至臨終護(hù)理等等。
比如90%的宮頸癌是可以預(yù)防和治愈的。宮頸癌從感染到癌變可以長(zhǎng)達(dá)10年,10年足以讓患者做很多的工作,讓它不產(chǎn)生癌變。而宮頸癌跟很多風(fēng)險(xiǎn)因子有很直接的關(guān)系,我們有了數(shù)據(jù),就可以針對(duì)這些高風(fēng)險(xiǎn)的宮頸癌感染人群進(jìn)行預(yù)防和護(hù)理,改變不利的生活方式,那么就能夠延遲,甚至成功地阻止宮頸癌癌變。
那么有了大數(shù)據(jù)和大預(yù)防,我們城市生活當(dāng)中的醫(yī)療資源還可以得到更好、更恰當(dāng)?shù)睦谩?
這是我們?cè)谝郧鞍I茏龅囊恍┭芯?,這個(gè)金字塔上的百分比是有病人口的百分比,金字塔側(cè)面的數(shù)據(jù)是,它對(duì)社會(huì)醫(yī)療資源的消耗程度。
那么我們就看到了,健康人群只消耗一個(gè)社會(huì)20%的衛(wèi)生資源,其他80%都被有病人群消耗掉了。在有病人群里面,只有20%左右是非常復(fù)雜的非常急的病,這些病會(huì)消耗掉整體60%的資源。
這就告訴我們,如果我們可以盡量阻止健康人口變成有病人口,防止慢性病人口變成復(fù)雜病人口,那么我們就能把社會(huì)的醫(yī)療資源節(jié)約起來(lái),更合理地匹配和應(yīng)用。
那么我們將來(lái)還會(huì)需要那么多醫(yī)院?jiǎn)?答案是:不需要那么多了。
我們還需要醫(yī)院,但是我們可以在大數(shù)據(jù)的指引下,對(duì)人生活的每一個(gè)階段進(jìn)行干預(yù)和指導(dǎo),做個(gè)性化的醫(yī)療服務(wù)。
有了大數(shù)據(jù),我們對(duì)城市人口的集體行為有了更多的認(rèn)知,我們了解到一個(gè)社會(huì)是如何互動(dòng)的,數(shù)據(jù)可以對(duì)出現(xiàn)的問(wèn)題提供有針對(duì)性的解決方案,我們將會(huì)因此而更健康,我們的生存環(huán)境將會(huì)因此而更美好。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03