
醫(yī)療大數(shù)據(jù)的“茍且”與遠(yuǎn)方
醫(yī)療人工智能的基礎(chǔ),是醫(yī)療大數(shù)據(jù)的挖掘和應(yīng)用。有關(guān)醫(yī)療大數(shù)據(jù),這是這幾年互聯(lián)網(wǎng)醫(yī)療領(lǐng)域流傳最廣的故事。雖然每一家創(chuàng)業(yè)公司的模式千差萬(wàn)別,但無(wú)一例外都會(huì)有一條:對(duì)大數(shù)據(jù)的挖掘和應(yīng)用,雖然關(guān)于如何實(shí)現(xiàn)的部分往往語(yǔ)焉不詳。這充分反映了兩個(gè)問(wèn)題:所有人都意識(shí)到了醫(yī)療大數(shù)據(jù)開(kāi)發(fā)的價(jià)值,但開(kāi)發(fā)的路徑卻難度很高。
于是,我們聽(tīng)到的第一代醫(yī)療大數(shù)據(jù)的故事就變成了以下這個(gè)樣子:
▍有關(guān)數(shù)據(jù)來(lái)源
中國(guó)互聯(lián)網(wǎng)醫(yī)療可以說(shuō)是白手起家,至今為止仍然不受傳統(tǒng)醫(yī)療體系待見(jiàn)。所以,早期的醫(yī)療大數(shù)據(jù)基本上都只能來(lái)自互聯(lián)網(wǎng)醫(yī)療公司自身的積累。這里的“早期”既指時(shí)間上的早期,又包括開(kāi)發(fā)思路上的早期。那么,早期的數(shù)據(jù)來(lái)源大概有這么幾類(歡迎補(bǔ)充):
在線咨詢類公司——這類公司既有綜合型的,又有垂直型的。數(shù)據(jù)積累的方式上主要是通過(guò)醫(yī)患在線問(wèn)診的方式,建立患者個(gè)人的電子健康檔案;
智能硬件類公司——純粹的智能硬件在醫(yī)療領(lǐng)域的應(yīng)用日漸式微,但越來(lái)越多的醫(yī)療服務(wù)開(kāi)始結(jié)合智能硬件,比如血糖、血壓、體溫、心律等,數(shù)據(jù)積累方式主要是對(duì)用戶體征數(shù)據(jù)的檢測(cè);
基因檢測(cè)類公司——基因檢測(cè)在近兩年日趨火爆,主要是受到檢測(cè)成本降低和精準(zhǔn)醫(yī)療的推動(dòng),門檻大大降低,使得越來(lái)越多的普通用戶能夠消費(fèi)基因檢測(cè)。
科研工具類公司——雖然與醫(yī)患資源類公司一樣是收集患者的疾病數(shù)據(jù),但科研類公司收集數(shù)據(jù)的形式、應(yīng)用明顯不同,科研機(jī)構(gòu)在數(shù)據(jù)積累過(guò)程中發(fā)揮了主導(dǎo)作用。
▍有關(guān)數(shù)據(jù)應(yīng)用
在醫(yī)療大數(shù)據(jù)版本一的故事里面,之所以是早期,主要還是因?yàn)殚_(kāi)發(fā)利用方式的早期。在這個(gè)階段,雖然關(guān)于醫(yī)療大數(shù)據(jù)、人工智能已經(jīng)有了概念,但在此時(shí)能接受這樣故事的人畢竟還太少,也太遙遠(yuǎn)。于是,版本一里面應(yīng)用醫(yī)療大數(shù)據(jù)的方式基本有這么積累:
服務(wù)于醫(yī)療本身——長(zhǎng)期以來(lái),患者個(gè)人是不掌握自己的醫(yī)療數(shù)據(jù)的?;ヂ?lián)網(wǎng)醫(yī)療出現(xiàn)后,用戶可以通過(guò)手機(jī)來(lái)收集自己的健康數(shù)據(jù),幫助醫(yī)生更好的了解自身的健康歷史;
服務(wù)于醫(yī)藥企業(yè)——藥企對(duì)數(shù)據(jù)的需求既強(qiáng)烈又多元,包括市場(chǎng)營(yíng)銷需求、新藥研發(fā)需求、應(yīng)用反饋需求等。因此,鑒于藥企買單欲望強(qiáng)烈,很多數(shù)據(jù)應(yīng)用商都主動(dòng)向藥企考慮;
服務(wù)于保險(xiǎn)公司——這一點(diǎn)中美有些差異,美國(guó)保險(xiǎn)公司對(duì)數(shù)據(jù)的應(yīng)用主要是對(duì)醫(yī)療服務(wù)質(zhì)量和費(fèi)用的控制,而在我國(guó),保險(xiǎn)公司對(duì)數(shù)據(jù)的應(yīng)用則主要是設(shè)計(jì)新的保險(xiǎn)產(chǎn)品。
▍有關(guān)應(yīng)用現(xiàn)狀
其實(shí)在版本一的故事里,已經(jīng)有一些有了很好的應(yīng)用效果,比如藥物警戒,用醫(yī)療數(shù)據(jù)來(lái)彌補(bǔ)臨床數(shù)據(jù)的缺陷,及時(shí)反饋藥品不良反應(yīng)、治療效果等;再比如保險(xiǎn)控費(fèi),用醫(yī)療大數(shù)據(jù)控制服務(wù)質(zhì)量和費(fèi)用,控制和減少保險(xiǎn)欺詐行為等。這些領(lǐng)域之所有比較好的應(yīng)用,主要是因?yàn)樗幤蠛捅kU(xiǎn)公司的商業(yè)驅(qū)動(dòng)力更強(qiáng)。當(dāng)然,這也僅是在美國(guó)。
雖然我們前面羅列了不少有關(guān)醫(yī)療數(shù)據(jù)的來(lái)源和積累,但實(shí)際當(dāng)中,這些案例都或多或少存在著問(wèn)題。甚至由于這些問(wèn)題的存在,版本一里面這些比較淺層次的數(shù)據(jù)應(yīng)用都還處于非常遙遠(yuǎn)的階段。
數(shù)據(jù)的完整和有效性——互聯(lián)網(wǎng)醫(yī)療畢竟是新興事物,用戶有接受程度和使用習(xí)慣的問(wèn)題,而且硬件設(shè)備也存在功能和精準(zhǔn)度的問(wèn)題。這使得數(shù)據(jù)收集面臨著不完整且缺乏連續(xù)性的問(wèn)題,而且大多數(shù)硬件設(shè)備沒(méi)有取得醫(yī)療資質(zhì),采集的數(shù)據(jù)也無(wú)法做醫(yī)療級(jí)應(yīng)用。
數(shù)據(jù)處于割裂的狀態(tài)——互聯(lián)網(wǎng)醫(yī)療產(chǎn)品主要收集的是患者在醫(yī)院的健康數(shù)據(jù),而對(duì)醫(yī)院內(nèi)的數(shù)據(jù)鞭長(zhǎng)莫及。加上醫(yī)院與互聯(lián)網(wǎng)醫(yī)療無(wú)法打通,這導(dǎo)致了醫(yī)療數(shù)據(jù)在院內(nèi)院外割裂存在的狀況。而且由于醫(yī)院本身信息孤島的問(wèn)題,患者在不同醫(yī)院求醫(yī)的數(shù)據(jù)也是碎片化存在。
數(shù)據(jù)規(guī)模仍然非常小——作為大數(shù)據(jù)應(yīng)用,目前的醫(yī)療數(shù)據(jù)采集規(guī)模根本達(dá)不到“大”的程度。一個(gè)是很多創(chuàng)業(yè)公司的數(shù)據(jù)都是從頭積累,再一個(gè)是市場(chǎng)認(rèn)知度仍然有限,最典型的就是基因檢測(cè),很多公司的樣本量還處在幾十個(gè)、幾百個(gè)的水平。這使得目前的醫(yī)療數(shù)據(jù)基本無(wú)法實(shí)現(xiàn)商業(yè)化。
當(dāng)然還有一個(gè)問(wèn)題,段院長(zhǎng)在他的文章里也指出了,就是醫(yī)療大數(shù)據(jù)并沒(méi)有被認(rèn)真對(duì)待,或者說(shuō)掛羊頭賣狗肉。我國(guó)的大多數(shù)互聯(lián)網(wǎng)醫(yī)療公司打的仍然是醫(yī)院號(hào)源的主意,仍然是一種快速變現(xiàn)的心態(tài),也無(wú)怪乎令人感嘆,“我們多數(shù)的移動(dòng)醫(yī)療創(chuàng)新公司還在拼命的靠補(bǔ)貼靠地推在拉用戶,在做掛號(hào)黃牛的生意,真的令人很失望?!?
故 事
版 本 二
關(guān)于醫(yī)療大數(shù)據(jù),最令人興奮的應(yīng)用無(wú)疑還是在臨床方面。比如時(shí)下最熱門的精準(zhǔn)醫(yī)療幾乎火到?jīng)]朋友。但精準(zhǔn)醫(yī)療因?yàn)橄鄬?duì)初級(jí)還跟數(shù)據(jù)應(yīng)用關(guān)系不大,主要是取決于兩點(diǎn):要么是技術(shù)上取得特別重大的突破,要么是概念上找到特別唬人的方法。另外一個(gè)醫(yī)療大數(shù)據(jù)在臨床上的應(yīng)用,則是臨床輔助診斷,或者更遙遠(yuǎn)一點(diǎn),人工智能醫(yī)生。
在臨床上發(fā)揮機(jī)器的作用,首先需要對(duì)臨床數(shù)據(jù)的有效挖掘利用。傳統(tǒng)的公立醫(yī)院在這一點(diǎn)上是完全指望不上的,根本原因在于沒(méi)有任何激勵(lì)機(jī)制的存在。而早期醫(yī)療大數(shù)據(jù)的應(yīng)用之所以對(duì)醫(yī)院敬而遠(yuǎn)之,主要是開(kāi)發(fā)難度太高。
受限于信息化程度,醫(yī)院往往處于信息孤島的封閉狀態(tài),內(nèi)部信息系統(tǒng)紛繁復(fù)雜標(biāo)準(zhǔn)不一,而且有大量的病例數(shù)據(jù)以紙質(zhì)狀態(tài)存在。數(shù)據(jù)清洗要實(shí)現(xiàn)標(biāo)準(zhǔn)化、結(jié)構(gòu)化的難度非常大,而且還需要打通院內(nèi)院外數(shù)據(jù)的流動(dòng)。
當(dāng)然,這里還必須提到數(shù)據(jù)安全。美國(guó)已經(jīng)不止一次爆出醫(yī)療數(shù)據(jù)泄露或受到攻擊的案例。而來(lái)自Ponemon推出的一份報(bào)告《2013年數(shù)據(jù)泄露成本研究》顯示,醫(yī)療行業(yè)的數(shù)據(jù)泄露成本最高,平均每個(gè)患者的醫(yī)療信息泄露帶來(lái)的信息安全管理成本高達(dá)233美元,遠(yuǎn)高于零售業(yè)的78美元。而當(dāng)大量商業(yè)公司在明目張膽的打著靠數(shù)據(jù)賺錢旗號(hào)的時(shí)候,臨床數(shù)據(jù)的開(kāi)發(fā)確實(shí)需要非常謹(jǐn)慎。
▍新數(shù)據(jù)來(lái)源
不過(guò)臨床數(shù)據(jù)開(kāi)發(fā)的遲滯,仍然是造成我們的醫(yī)療大數(shù)據(jù)推進(jìn)緩慢的一個(gè)重要因素。所以,在版本二的故事里,我們看到了已經(jīng)有創(chuàng)業(yè)公司努力在臨床數(shù)據(jù)上進(jìn)行探索。(歡迎補(bǔ)充)
臨床數(shù)據(jù)的聚合 ——醫(yī)院內(nèi)的醫(yī)療數(shù)據(jù)也是分散的,HIS、LIS、PACS等系統(tǒng)里都儲(chǔ)存不同類型的病例數(shù)據(jù)。因?yàn)檫@些系統(tǒng)來(lái)自不同廠商,數(shù)據(jù)標(biāo)準(zhǔn)不一,醫(yī)院內(nèi)部也缺乏完整、連續(xù)的數(shù)據(jù)資料。所以,在醫(yī)院實(shí)現(xiàn)數(shù)據(jù)聚合成為臨床數(shù)據(jù)開(kāi)發(fā)的一個(gè)小前提。已經(jīng)有創(chuàng)業(yè)公司在這方面探索,并得到了資本市場(chǎng)的認(rèn)可。
臨床數(shù)據(jù)的開(kāi)放——當(dāng)然還不是公立醫(yī)院數(shù)據(jù)的開(kāi)放,而且公立醫(yī)院目前的信息系統(tǒng)也很難支持開(kāi)放。不過(guò),已經(jīng)有很多創(chuàng)業(yè)公司在嘗試臨床數(shù)據(jù)開(kāi)放,甚至直接開(kāi)辦醫(yī)院、診所來(lái)重構(gòu)底層信息系統(tǒng)。再加上很多SaaS模式的診所管理系統(tǒng)的出現(xiàn),就為醫(yī)療數(shù)據(jù)的共享以及與智能硬件設(shè)備的對(duì)接創(chuàng)造了條件。
臨床數(shù)據(jù)去中心——很多人相信,醫(yī)院只是時(shí)代的產(chǎn)物,會(huì)逐漸消失,所以醫(yī)療數(shù)據(jù)也未必一定要在醫(yī)療機(jī)構(gòu)內(nèi)產(chǎn)生。隨著新技術(shù)和數(shù)據(jù)采集方式的進(jìn)步,包括診療數(shù)據(jù)、研發(fā)數(shù)據(jù)等,都在逐漸突破醫(yī)療機(jī)構(gòu)的邊界,進(jìn)入人們的客廳、日常生活。這種數(shù)據(jù)采集的量和周期,都是醫(yī)院內(nèi)數(shù)據(jù)采集所無(wú)法比擬的。
▍應(yīng)用和問(wèn)題
這些在臨床數(shù)據(jù)開(kāi)發(fā)方面的努力,為未來(lái)人工智能的研發(fā)創(chuàng)造了可能。恐怕也還只是限于可能,距離真正的應(yīng)用還有一段距離。當(dāng)然,在AlphaGo完勝李世石以后,人工智能所展示出的進(jìn)步速度讓所有人驚艷。說(shuō)不定五年后,機(jī)器人醫(yī)生就真的出現(xiàn)在社區(qū)診所了。但是眼下的問(wèn)題恐怕還是必須要克服:
數(shù)據(jù)解讀——圍棋棋盤(pán)的可能性畢竟是可以窮盡的,但目前的人工智能還無(wú)法解決未知因素的問(wèn)題。尤其是在醫(yī)療領(lǐng)域,不僅是未知因素的問(wèn)題,甚至還有無(wú)知因素的問(wèn)題。很多因素不僅醫(yī)療數(shù)據(jù)的采集范圍之外,更是在人類的認(rèn)知范圍之外。不要說(shuō)癌癥這種人類尚未攻克的疾病,絕大多數(shù)疾病都存在著相當(dāng)多的未知因素。
數(shù)據(jù)規(guī)?!t(yī)療數(shù)據(jù)的應(yīng)用前提條件是數(shù)據(jù)規(guī)模要足夠大。其實(shí),這一點(diǎn)中國(guó)的情況要比美國(guó)好多了。比如說(shuō),中國(guó)一家三甲醫(yī)院的數(shù)據(jù)量幾乎抵得上美國(guó)一個(gè)州的量。但問(wèn)題是,有能力、有條件、有機(jī)會(huì)開(kāi)發(fā)應(yīng)用這些數(shù)據(jù)的機(jī)會(huì)太少。財(cái)大氣粗的保險(xiǎn)公司在醫(yī)院面前都毫無(wú)談判能力,遑論弱小的互聯(lián)網(wǎng)醫(yī)療公司??峙轮荒苤竿哒斑h(yuǎn)矚的醫(yī)院院長(zhǎng),發(fā)揮鯰魚(yú)效應(yīng)。
數(shù)據(jù)監(jiān)管——對(duì)于政府監(jiān)管來(lái)說(shuō),醫(yī)療數(shù)據(jù)的應(yīng)用是個(gè)新問(wèn)題。起碼至今,究竟醫(yī)療數(shù)據(jù)歸誰(shuí)所有的問(wèn)題都沒(méi)有明確。而一旦醫(yī)療數(shù)據(jù)被濫用,危害是極大的。一個(gè)非常簡(jiǎn)單的道理,你的銀行卡密碼可以修改,但你的基因信息能修改么?雖然現(xiàn)在對(duì)基因的解讀能力有限,但是只要樣本成功采集一次,就可以無(wú)限檢測(cè)。所以如果你的基因數(shù)據(jù)泄露了,后果會(huì)是怎樣呢?
最后,可能還是野心的問(wèn)題。如果已經(jīng)收集到了一批數(shù)據(jù),馬上就能商業(yè)變現(xiàn),就能掙大錢,有幾個(gè)人還愿意去搞什么人工智能呢?
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03