
在現(xiàn)實世界中使用數(shù)據(jù)科學(xué)的專家提示
許多企業(yè)正在采用和部署大數(shù)據(jù)應(yīng)用程序以獲得競爭優(yōu)勢,但其中許多企業(yè)正在“在工作中學(xué)習(xí)”,盡其所能地反復(fù)試驗,但所獲得的結(jié)果不一。為了提供行業(yè)指導(dǎo),行業(yè)媒體記者James
Maguire與兩位數(shù)據(jù)科學(xué)領(lǐng)域的專家進行了探討與交流,討論如何將這種快速發(fā)展的技術(shù)用于當(dāng)今的業(yè)務(wù)。
這兩位專家是:博思艾倫咨詢公司的高級助理Seth Clark,糖尿病遠程醫(yī)療提供商Virta Health公司研究主管James McCarter博士。
以下是媒體記者James Maguire與兩位專家進行的廣泛而深入的討論的精彩內(nèi)容:
James Maguire:請問你在開發(fā)數(shù)據(jù)科學(xué)時遇到的挑戰(zhàn)或障礙是什么?
Seth
Clark:“我認為開發(fā)數(shù)據(jù)科學(xué),這種差距最大的挑戰(zhàn)之一就是信任。人類需要相互信任,而在兩個人之間建立信任需要一個明確的過程。通常,這只是需要更長的時間和豐富的經(jīng)驗。很多人都說他們要做某事,然后去做。但弄清人們?nèi)绾涡湃螖?shù)據(jù)算法很難,但需要相信數(shù)據(jù)分析會告訴人們做出的決定。對于人類來說,這是一個非常模糊的嘗試和信任。
所以,我們希望著重于文化轉(zhuǎn)型,可以為技術(shù)專家、數(shù)據(jù)科學(xué)家、開發(fā)人員等提供幫助。人們需要充分理解數(shù)據(jù)科學(xué)是如何工作的,以便當(dāng)有結(jié)果輸出時,他們可以真實地查看數(shù)據(jù)背后的數(shù)據(jù),并且會在想我知道這是從哪里來的,我認為這是值得信賴的。我們根據(jù)這些見解做出一些決定,看看會發(fā)生什么。人們必須對此具備信心,相信它會好起來的。”
James Maguire:當(dāng)遇到數(shù)據(jù)科學(xué)并使用它時,你遇到了什么樣的障礙或挑戰(zhàn)?
James McCarter:“就像Seth Clark所言,我的回答也傾向于文化,也就是企業(yè)所建立的文化。在過去的三年中,我們已經(jīng)創(chuàng)建了Virta公司,它是來自醫(yī)學(xué)和研究領(lǐng)域的臨床實踐的融合者,并且將這些與來自快速移動軟件和IT文化結(jié)合在一起。
我認為它的一部分是試圖了解人們正在構(gòu)建的算法的目的是什么,或者生成的數(shù)據(jù)的目的是什么。這是質(zhì)量與速度的問題。那么,企業(yè)是否在嘗試做出當(dāng)今需要的內(nèi)部決策,這將影響未來幾周的工作?或者是否正在編寫一份將要提交給同行評審出版物的數(shù)據(jù)集,其影響將會持續(xù)數(shù)十年。試圖在質(zhì)量與速度之間找到這種平衡是我們在過去幾年中變得更好的事情。”
James Maguire:我認為Facebook公司創(chuàng)始人馬克·扎克伯格的著名言論:“迅速行動并顛覆事物”,這個理論可能適用于社交媒體網(wǎng)絡(luò),但我認為它不適用在醫(yī)療環(huán)境中。
James McCarter:我認同你的觀點,我認為不要在醫(yī)療行業(yè)中快速采取行動并進行顛覆。對我們來說最重要的是耐心的結(jié)果、安全性和可持續(xù)性。所以,任何危害這些的東西都是我們不能發(fā)展的方向?!?br />
James Maguire:數(shù)據(jù)科學(xué)從業(yè)者可以“信任”某一種算法嗎?
James
McCarter:“似乎人們面臨其中的一個挑戰(zhàn)是算法可能會改變。我的意思是,如果它內(nèi)置了人工智能,或者它會隨著時間的推移而發(fā)展。一個從業(yè)人員如何真正相信其算法,并且知道這是正確的?換句話說,我們使用的這個工具是一個靈活的、不斷變化的工具。這是一款不斷發(fā)展的軟件。我們怎樣才能相信它呢?”
Seth Clark:“人們正在談?wù)撊斯ぶ悄芎?a href='/map/shenduxuexi/' style='color:#000;font-size:inherit;'>深度學(xué)習(xí)領(lǐng)域試圖達成的主題之一。有很多方面需要信任。所以,人們正在考慮一種算法,例如給出一個非此即彼答案的東西,以及更像是一個虛擬助手的東西。有些東西會給人們提供一些建議,而且這些建議也有一定的信心。
就像我給你提供一些建議一樣。如果在一些方面我了解很多,也許你相信我。如果這件事情我不了解,那么我的建議可能并沒有什么作用。我可能擁有其他知識,例如音樂和航海,我提供給你一些建議,但它可能并不具有什么價值,而一些相應(yīng)的知識會幫助我給出一個很好的答案,但我沒有這些知識。
因此,同樣的道理,確保不要期望某種人工智能算法將會處理所有事情,人們需要理解它的局限性。很多這些限制歸結(jié)于人們用于創(chuàng)建這些預(yù)測算法的數(shù)據(jù)。所以,人們經(jīng)常會問,‘正在使用的數(shù)據(jù)有多好?這在實際上是不是有用的數(shù)據(jù)?我能相信一直在訓(xùn)練這個算法的數(shù)據(jù)嗎?’而如果不能信任這些數(shù)據(jù),就必須對其降低一些期望。
所以,我認為它正在改變?nèi)藗兊乃季S方式,然后再看看構(gòu)成預(yù)測的所有構(gòu)成要素,以幫助人們理解是否應(yīng)該相信這一點。我現(xiàn)在對McCarter也想問同樣的問題。而他作為一名臨床醫(yī)生的角度如何來看待,我會感到好奇。醫(yī)生如何說服其患者相信預(yù)測性的見解?我認為它與其他的操作是非常不同的,而不是說服某人采取某種療程?!?br />
James Maguire:我感覺這是一個非常重要的問題。例如,你對此有何看法?你相信這個算法嗎?或者,患者如何信任這個算法?
James
McCarter:“我們的每個患者都有自己的健康助理和醫(yī)生。正如我所提到的,我們是一個以醫(yī)生為主導(dǎo)的組織。所以,Virta醫(yī)生都是Virta公司的員工,我們的健康助理也是如此,他們大多是營養(yǎng)師、護士,以及其他健康從業(yè)人員,以及臨床醫(yī)生。所以,這才是真正的人際關(guān)系。
但是,如果患者考慮如何實際逆轉(zhuǎn)Ⅱ型糖尿病,我們不會通過建立取代醫(yī)生的人工智能來做到這一點。我們所做的是兩項創(chuàng)新:一個是營養(yǎng)領(lǐng)域。這是一種稱為營養(yǎng)性酮癥的方法,如果可以使其在現(xiàn)實世界中發(fā)揮作用,它對于逆轉(zhuǎn)Ⅱ型糖尿病非常有效。第二,為了在現(xiàn)實世界中做到這一點,我們開發(fā)了一種名為為持續(xù)遠程護理的服務(wù)。這背后的想法是,這就像在任何時候都有健康助理和醫(yī)生陪護在患者身邊一樣。它們可以通過一個應(yīng)用程序來實現(xiàn)??梢悦刻於啻闻c患者接觸,而不是每年幾次。因此,我們認為數(shù)據(jù)科學(xué)是提供持續(xù)遠程醫(yī)療的基礎(chǔ)。所以,這不是為了取代醫(yī)生,而是為醫(yī)生提供了更多的權(quán)力。”
James Maguire:你從數(shù)據(jù)科學(xué)中學(xué)到了什么?
Seth Clark:“我認為這是‘以人為本’。
我認為應(yīng)對技術(shù)挑戰(zhàn)比處理人為問題更容易。組織需要關(guān)注其正在建設(shè)的團隊,支持團隊的方式,以及為多元化團隊提供便利的方式,這非常重要。現(xiàn)在人工智能領(lǐng)域存在一個主要的話題,那就是人工智能所帶來的偏見。例如有一群20多歲的白種技術(shù)人員在開發(fā)一種特殊的算法。他們的生活經(jīng)歷會以某種方式呈現(xiàn)在他們編寫的代碼中嗎?
他們訓(xùn)練數(shù)據(jù)的方式或他們選擇數(shù)據(jù)來訓(xùn)練這些算法的方式是這樣的?答案是肯定的。這幾乎就像采用技術(shù)提高能力一樣。像Nvidia這樣的公司正在發(fā)布新的硬件,這些硬件可以為各種用戶提供深入的學(xué)習(xí)和真正的高端人工智能,但我們必須把重點放在人性上而不是技術(shù)上。不是說技術(shù)方面的問題很簡單,而是人類的問題在處理上更難。
因此,著眼于建立一個能夠思考人工智能和數(shù)據(jù)科學(xué)將提供給人類的終極價值觀的多元化團隊,我認為這是至關(guān)重要的。”
James
McCarter:“我曾經(jīng)提到過一些擴展方面的事情,那就是我們試圖做一些類似于眾包的功能。建立一個病人社區(qū)。這是我們實施策略一部分,除了生物標(biāo)志物反饋和在線教育資料以及健康教練和醫(yī)生之外,實施策略的第五個組成部分是一個在線社區(qū),患者可以互相提供信息。”
James Maguire:“它實際上是一個點對點網(wǎng)絡(luò)?!?br />
James
McCarter:“這是一個對等網(wǎng)絡(luò)。這是可選的。如果人們覺得不能分享或沒有必要分享,那么可以不分享。但如果他們愿意的話,它就像點一份菜單一樣簡單。而這些更多的時候是情感上的支持,分享勝利和挫折,并向他人尋求建議和支持。我們現(xiàn)在正在研究的另一個方面是,我們實際上開展了逆轉(zhuǎn)Ⅱ型糖尿病的最大和最長的試驗。但是,到現(xiàn)在為止才兩年的時間,只有五百人接受試驗。
而我們現(xiàn)在正在治療成千上萬的患者,我們?yōu)榇藙?chuàng)建了Virta
Health注冊中心,這是一個機構(gòu)審查委員會,醫(yī)院倫理委員會(IRB)批準(zhǔn)了我們的患者同意的協(xié)議。我們發(fā)現(xiàn)超過80%的患者選擇加入。這使得他們的匿名和匯總數(shù)據(jù)可用于臨床研究。所以,這使得我們可以看到成千上萬的結(jié)果,而不僅僅是數(shù)百個結(jié)果。我們在數(shù)據(jù)科學(xué)領(lǐng)域首先構(gòu)建的一些東西是預(yù)測性算法,它們使我們能夠了解患者在接下來的幾周和幾個月中的表現(xiàn),然后優(yōu)先考慮為他們安排健康助理。
所以,就像面向病人的應(yīng)用程序一樣,還需要一個面向健康助理和醫(yī)生的應(yīng)用程序。因此,我們實際上提供了一個優(yōu)先級排列,可以讓醫(yī)生為最需要診療護理的這些患者進行治療。這種排列的方式是通過觀察人們的未來幾周的血糖控制情況進行預(yù)測,他們的體重在未來幾周預(yù)測的趨勢如何,他們?nèi)绾伪A艉蛥⑴c的治療可能會在接下來的幾周內(nèi)完成。因此,這些都是基于數(shù)據(jù)科學(xué)算法構(gòu)建的,這些算法基于患者的基本健康特征,以及我們從他們那里得到的日常反饋。我們將繼續(xù)改進這些算法。”
James Maguire:數(shù)據(jù)分析和數(shù)據(jù)科學(xué)也在不斷發(fā)展。如果我們將在2020年或2022年開展同樣的對話,那么當(dāng)我們談?wù)摂?shù)據(jù)科學(xué)時,你會談些什么?
Seth
Clark:“這是我的愿望清單。我希望看到的是更廣泛地接受人工智能。人工智能的某些方面存在著一種缺陷,這只是因為它有一種非??膳碌目苹眯≌f氛圍,它會讓人們失望。事實上,很多人工智能基本上只是用來提供服務(wù)的。每個人都希望有自己的私人助理。所以想象一下,如果人們有自己的個性化Siri,可以幫助在日常生活和工作的各個方面提供幫助的話。人們就會喜歡和接受人工智能。
我認為還有另一個領(lǐng)域適用,我希望在數(shù)據(jù)科學(xué)領(lǐng)域看到更好的代表。我真的期待著會有一個適合的時間和空間,可以根據(jù)種族、性別、宗教信仰等類別獲取人們的微觀縮影,你會發(fā)現(xiàn)在數(shù)據(jù)科學(xué)和預(yù)測分析方面會更加平等。我認為擁有更好的表現(xiàn)是非常重要的,我們不會陷入這種無意識偏見的境地。所以,我很樂意看到這一點。
我很愿意看到美國各行業(yè)領(lǐng)域采用更多的人工智能來進行管理。我認為我們所做的事情可以做得更好。這將改善公民服務(wù),為人們帶來更好的生活。所以,未來我們再聚在一起探討時,我希望在愿望清單中看到三件事。”
James Maguire:“當(dāng)然,我喜歡樂觀主義。當(dāng)我們在未來幾年談?wù)摂?shù)據(jù)科學(xué)時,我們將談?wù)撌裁?。這很難預(yù)測,但是,為什么不試一試呢?!?br />
James
McCarter:“我認為數(shù)據(jù)科學(xué)與軟件工程、用戶體驗設(shè)計、移動和遠程能力以及這些元素一起將會顛覆醫(yī)學(xué)。所以,如果想想現(xiàn)在是如何交付藥品的,我會說這非常失敗,對吧?我們在醫(yī)院有很多資金投入,人們通常到醫(yī)院就診,但是他們每年只能去少數(shù)幾次,或者如果他們正在治療慢性疾病時,那么他們每年就醫(yī)時,看到醫(yī)生只有2-3次,每次持續(xù)時間為15分鐘。
因此,我們以非常傳統(tǒng)的方式提供醫(yī)療服務(wù)。但是,如果人們查看其花費在哪里,那么會發(fā)現(xiàn)大部分藥品的費用花費在慢性疾病上,大多是慢性代謝疾病。解決這些問題的辦法不是建立更多的醫(yī)院,也不是通過醫(yī)院提供更多的藥品、醫(yī)療影像、手術(shù)來改變。處理這個問題的方式是通過人們的日常行為來改變。幫助支持這種行為改變的方法是持續(xù)遠程護理的模型。因此,我認為未來十年里,人們將看到的大部分花費在藥品上的費用由到醫(yī)院治病轉(zhuǎn)向遠程護理。
大部分慢性代謝疾病都可以遠程處理。他們不需要親自去醫(yī)院就診。如果我們想要控制成本曲線,就必須使用技術(shù)來推動這種行為變化,而不是推出更多更新的技術(shù)來提供更多的藥品和手術(shù)?!?br />
James Maguire:所以,你談?wù)摰拇_是一種分散的醫(yī)學(xué)模式。
James. McCarter:“我認為是這樣的。醫(yī)療行業(yè)的技術(shù)發(fā)展已經(jīng)十分成熟。當(dāng)人們看到實際上可以提供持續(xù)的遠程護理時,那么數(shù)據(jù)科學(xué)必須成為核心。”
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03