99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁大數(shù)據(jù)時(shí)代謝邦昌:數(shù)據(jù)礦業(yè)挖掘新時(shí)代
謝邦昌:數(shù)據(jù)礦業(yè)挖掘新時(shí)代
2021-08-05
收藏

編者按:9月11日—9月12日,由經(jīng)管之家(原人大經(jīng)濟(jì)論壇)主辦的“2015中國數(shù)據(jù)分析師行業(yè)峰會(CDA?Summit)”在北京舉行。本文是臺北醫(yī)學(xué)大學(xué)教授謝邦昌在峰會上的演講全文,謝邦昌教授演講的主題是“大數(shù)據(jù)在生技醫(yī)療之應(yīng)用”。




各位嘉賓、各位先生、各位女士,大家早安!


很高興被稱為老教授,實(shí)際上也很老了。聽完吳院長的一悉話,我今天所介紹的比較簡單,在醫(yī)學(xué)領(lǐng)域大數(shù)據(jù)的應(yīng)用。我也希望能夠告訴大家大數(shù)據(jù)這幾年來它所發(fā)揮的作用。


剛剛吳院長提到大數(shù)據(jù)在這方面的應(yīng)用,其實(shí)有一句話很重要。我們知道沒有人擁有所有的數(shù)據(jù),你怎么在既有的數(shù)據(jù)中間找到自己的數(shù)據(jù),這是最重要的。剛剛我跟吳院長溝通一些事情,大家知道在大數(shù)據(jù)領(lǐng)域中,我們有三個(gè)領(lǐng)域,IaaS、SaaS、PaaS。在SaaS的大概99.99%,我們都不是IaaS、PaaS這個(gè)領(lǐng)域的人,但是現(xiàn)在很多人都在往IaaS、PaaS這里面走,我們應(yīng)該是SaaS里面的人。


大家想一想我講的這句話,在醫(yī)療大數(shù)據(jù)中間,我們看一下醫(yī)療未來的發(fā)展。其實(shí)科學(xué)精確描述這個(gè)世界,現(xiàn)在的生物學(xué)在越來越朝向?qū)嵶C科學(xué)走。現(xiàn)在我們越來越多涉及到基因,為什么?我們要用大數(shù)據(jù)去解讀。所以在生命語言中間,心里我們?nèi)狈Φ氖橇私馍Z言。但是我們已經(jīng)有生命語言,我們不懂得生命語言的在哪里。


新的基因組定序,從植物、生物、微生物的定序,這方面的領(lǐng)域在各個(gè)方面占有很大的部分?,F(xiàn)在在很多領(lǐng)域研究,大數(shù)據(jù)里面60%都是在做健康這方面的研究。


關(guān)于人類基因組,對我們大數(shù)據(jù)來講很多人都覺得是無字天書。雖然我是學(xué)這個(gè)專業(yè)的,我跟我太太看這個(gè),我可以從統(tǒng)計(jì)和大數(shù)據(jù)的角度向她解釋一些原因,這些是人類基因。PM2.5跟你的健康有關(guān)系,跟你的基因有關(guān)系。甚至天氣、溫度會跟你的血壓和相關(guān)的健康狀況有關(guān)系。從Genes到Biochemical,最難的是我們怎么把數(shù)據(jù)加以整合和分析找出有用的信息。所以基因跟疾病之間的關(guān)系,有家族遺傳的關(guān)系。我們不知道這個(gè)病是什么樣的,我們要了解遺傳,我們要知道基因。


還有基因跟環(huán)境之間的交互,我有一次到北京來流鼻涕就好了,但是到臺北鼻涕一直有,你怎么把這兩個(gè)因素中間的數(shù)據(jù)找出來?;蛲蛔兣c癌癥之間的變化,他的家族病史告訴他,他可以從一些數(shù)據(jù)中找出原因,用大數(shù)據(jù)協(xié)助來做這件事情。所以在這些控制中間,我們越來越了解病因。


從大數(shù)據(jù)中間我們可以產(chǎn)生分子級的斷命家,這個(gè)已經(jīng)不是天方夜譚了,他可以依照你個(gè)人特質(zhì)化的基因來治療。未來是什么樣的,可不可以有干細(xì)胞產(chǎn)生某項(xiàng)器官,把你的藥效帶到心臟、血管任何的定位。這些東西是不是對人有用,是有用的,但是大數(shù)據(jù)怎么分析出這些東西。


有一些人研究干細(xì)胞的,結(jié)果發(fā)現(xiàn)干細(xì)胞存在人類身體所有的部分。尤其是第二大部分是這塊,你的脂肪里面的干細(xì)胞是最多的。特別是研究心臟和肺等等,對干細(xì)胞的研究我們一直在進(jìn)行,對干細(xì)胞的修復(fù)也是沒有問題的。還有就是納米技術(shù),這里面需要太多大數(shù)據(jù)的應(yīng)用了。


最后是無聲的殺手人類與微生物的戰(zhàn)爭,剛剛教授講到了流感的預(yù)測,很重要的是細(xì)菌不斷的演化,演化的速度比你預(yù)測的速度還要快。


大家可以知道在醫(yī)學(xué)上面的挑戰(zhàn)剛開始,它跟大數(shù)據(jù)的結(jié)合現(xiàn)在如火如荼的在做,我今年2月才轉(zhuǎn)到大數(shù)據(jù),我們需要做的就是這些整合。在這個(gè)情況下,今天跟大家談到的是所謂的大數(shù)據(jù)在醫(yī)療上的應(yīng)用。


其實(shí)剛才吳教授講過了,我請大家記住四個(gè)英文單詞SMAC(Social、Mobile、Analytics和Cloud),實(shí)際上手機(jī)和任何分析速度運(yùn)算來月快,請大家記住這四張圖形,Science一定告訴你data,時(shí)代雜志告訴你2045年那些事情,因?yàn)槿祟悤兂刹恍?,你相不相信這件事情,最后這件事情又引申了2045這件事情。


在2012年5月做了一個(gè)實(shí)驗(yàn),誰比較聰明,Warse最聰明,它是世界上益智賽觀者。大家回想十幾年前有一個(gè)深藍(lán),它贏了誰?贏了前蘇聯(lián)的棋王。告訴你,以后玩象棋游戲電腦陪你玩兒,這就叫電玩時(shí)代的來臨。這個(gè)就是人工智慧時(shí)代的來臨。大家手邊拿著一個(gè)手機(jī)叫智能手機(jī)。你以后家里的很多都冠上智能。連大數(shù)據(jù)都可以辦世界博覽會,我們原董事長也在場。世界博覽會(2015貴陽國際大數(shù)據(jù)產(chǎn)業(yè)博覽會),大家知道世界各大咖都集中在那。


我想說臺灣做的一件事比較好的,叫開放Data,政府在各方面的數(shù)據(jù)能公布的很多都能公布。我們所有的財(cái)政,電子發(fā)票等等這些,很有研究興趣的。還有健保資料部能公布的都能公布,然后加以整合,但是個(gè)人隱私的都不會公布。政府愿意公布這些材料說明政府開放出來,所以這件事情也很重要。中國政府現(xiàn)在重要的一件事情是怎么公布數(shù)據(jù)資料,雖然做了但是還是不夠。


馬云在5月的時(shí)候說的這句話,就是IT時(shí)代把人變成了機(jī)器,但是DT時(shí)代讓機(jī)器越來越接近人,越來越接近人的智慧。現(xiàn)在DT時(shí)代來臨不代表IT不重要,它還很重要,我們在座的99%的人大概都不是做Ass這塊,我們是做Saas這塊。速度越來越快,需求量越來越大,代表著云計(jì)算時(shí)代的來臨。所以不必?fù)?dān)心有這些種種,不見得每個(gè)人都建Data中心,該做什么的做什么,我們是要做解決方案的人。


記得,我現(xiàn)在看到很多都教育你怎么跳個(gè)層次,跳到里怎么找Data做這方面,No Data記得這些事情。我不是說這塊不重要,但是這塊相當(dāng)成熟了,這塊你讓該做的人做,大數(shù)據(jù)應(yīng)用很簡單的一句話,就是Data是什么。所以大忽悠麥肯錫忽悠大數(shù)據(jù),其實(shí)它之前就有了,但是忽悠的非常好。所以看大數(shù)據(jù)組織,聯(lián)合國組織,看看大家都在玩了,中國政府一看,再看美國白皮書,我該玩兒大數(shù)據(jù)了,所以2012年應(yīng)該是中國進(jìn)入大數(shù)據(jù)的元年,當(dāng)然中國跑的比誰都快,今年又辦了一個(gè)大數(shù)據(jù)的峰會。所以最重要的告訴大家,它提的大數(shù)據(jù)宣言,100多個(gè)國家,40多個(gè)企業(yè)提這個(gè)宣言的意義在哪里?我要定數(shù)據(jù)的規(guī)格,這是有真知灼見的。所以海峽兩岸的大咖都在這里。


大家可以看到在未來十年電腦的智慧,現(xiàn)在是老鼠,未來十年大概會接近人腦。所以剛剛已經(jīng)講過這個(gè)了,就是大數(shù)據(jù)的整合,剛剛吳院長說的就是Crisp的過程。我剛剛講過,以往來講這些分析方法什么的要用很多算法,像oracle等等都已經(jīng)把這些買下來了,這樣方法都有了,而且很簡單很快速。我剛才講了C+、R等等都有了,現(xiàn)在是解決方案的天下。我很快可以找到這個(gè)結(jié)果,我之所以用電腦是要證明給大家看,我簡單秀一下,大家就明白了。




這一張可以處理幾百萬的資料,假設(shè)在座的中小企業(yè)大概一兩百萬的資料,你用Excel就可以處理掉了。我剛才說做Guesting,我們這里有數(shù)據(jù)挖掘的預(yù)測,你要做預(yù)測,然后就是下一步,一步一步這樣下來,我就不一一講了。我要預(yù)測這三個(gè)地方的銷售量,我直接完成,完成之后,我們模型就直接出來了。大家可以看到,這是它的預(yù)測值就出來了,當(dāng)然它有它的模型。以這個(gè)來講,我們剛才講的也一樣。我想這些東西大家也都會。首先我就可以很快的做這些,剛剛吳院長講到的這些觀念。


很重要的是,我要看銷售的預(yù)測,要看它之間的關(guān)聯(lián)性,找到你買它們之間的關(guān)系。以這個(gè)來講一樣,我可以很快的找到,你今天購買的行為中間你會有哪些之間的結(jié)構(gòu)關(guān)系,然后你可以找到你買它們之間的結(jié)構(gòu)關(guān)系。剛才是幾萬的資料,買這個(gè)就可以知道其中的結(jié)構(gòu)關(guān)系。開始的秀只是為了證明,是你怎么找到這些資料,這些資料你能不能得到,你不能得到的話,你做分析資料,我剛才說No Data,你有再好的技術(shù)都是空的,但是現(xiàn)在大家都在賣產(chǎn)值給你,你沒有Data,什么都是枉費(fèi)的。所以百度可以做世界杯和任何的預(yù)測,所以未來是以Data為核心的生活。我們現(xiàn)在以大數(shù)據(jù)做一個(gè)分析,因?yàn)閮砂冬F(xiàn)在青少年問題越來越嚴(yán)重,我們警察局結(jié)合了教育部,結(jié)合它們的很多大數(shù)據(jù)分析,第一個(gè),先分析青少年常上網(wǎng)站的增量,然后找到之間的關(guān)聯(lián)性,找到這些關(guān)聯(lián)性之后就是語義分析,然后找出它的主題。我們看這些主題的監(jiān)管的知識,我們要做哪些事情?電子足跡,跟蹤這些,去輔導(dǎo)這些青少年。所以根據(jù)這些電子足跡,大家看到臺灣的青少年網(wǎng)站是Facebook等,我們可以很快找到這些,可以知道哪些要注意,還有領(lǐng)頭的意見領(lǐng)袖是誰,這其中就能看到相關(guān)性種種的,然后協(xié)助他們做毒品輔導(dǎo)之類的。電子足跡進(jìn)去后鎖定,然后找出毒品的來源,還有建立毒品的DNA,再建立大的數(shù)據(jù)庫。




這個(gè)跟我們五年前我們跟調(diào)查局做的一件事情,大家看這也是雜七雜八的,我們調(diào)查一個(gè)人,那個(gè)是毒犯判了進(jìn)了牢里后的記錄,這個(gè)記錄很復(fù)雜,這就是一個(gè)購買行為,這是他跟各類人的聯(lián)絡(luò),馬上就清楚的勾勒出來,勾勒出來之后結(jié)合兩岸的刑事警察局破獲了東南亞一個(gè)毒網(wǎng),這就是大數(shù)據(jù)的簡單應(yīng)用。沒有這些數(shù)據(jù),更多的應(yīng)用也沒用。


資料還可以用在治安,用在暴力犯罪預(yù)測,哪里的暴力犯罪最多,這個(gè)美國已經(jīng)在做了,這個(gè)可以用在大數(shù)據(jù)的數(shù)據(jù)的整合。臺灣有一個(gè)總體的資料庫,大家了解臺灣進(jìn)總體資料庫有很多是開放的,你可以看一看整個(gè)結(jié)構(gòu)。大陸我們協(xié)助過統(tǒng)計(jì)局做數(shù)據(jù)平臺,國家數(shù)據(jù),但是這些數(shù)據(jù)的開放性還不夠,同時(shí)也懷疑這些數(shù)據(jù)的準(zhǔn)確性,這些都是值得加強(qiáng)的,我就不再講了。


現(xiàn)在數(shù)據(jù)的整合越來越重要,DataTime已經(jīng)上新三板了,數(shù)據(jù)模仿。我們現(xiàn)在在做哪些事情?我在北醫(yī),我們原來做的有點(diǎn)像這件事情,這個(gè)我已經(jīng)向各位報(bào)告過了。我們現(xiàn)在做了三個(gè):醫(yī)療云、健康云,照顧云,走在大數(shù)據(jù)上。這三個(gè)云最重要的,臺灣叫健康保險(xiǎn),這里叫醫(yī)保數(shù)據(jù)庫。醫(yī)保數(shù)據(jù)庫,假如有信息化,你們可以進(jìn)去,因?yàn)檫@是開放的,但是需要申請,這里有不同的申請,它會教你怎么開放。這些東西怎么去串這些數(shù)據(jù)庫。所以你要有串?dāng)?shù)據(jù)庫,整合數(shù)據(jù)庫的能力,你要想怎么用Saas把這些數(shù)據(jù)庫整合出來,了解心臟病到底用什么藥。像剛剛講的乳癌,這個(gè)人家怎么做的,都可以清清楚楚知道,然后再來重大傷病,還有住院,醫(yī)療這些,清清楚楚的這些資料都可以開放,但是個(gè)人資料都沒有開放。


我們現(xiàn)在做的一件事情,我們有五家醫(yī)院,還有些一中心,我們將醫(yī)保、健保數(shù)據(jù)庫加以整合,能不能跟生活形態(tài),跟你的運(yùn)動,跟人類的生活形態(tài),甚至基因等加以整合,整合完以后數(shù)據(jù)處理,數(shù)據(jù)分析,它會產(chǎn)生什么樣的價(jià)值向各位報(bào)告,臺灣15年下來產(chǎn)生了有頂級影響力的研究報(bào)告。所以造就了這兩年來,你可以看到很多數(shù)據(jù),經(jīng)濟(jì)學(xué)人在今年公布了臺灣是宜居城市,臺灣的醫(yī)療在全世界是第三,亞洲第一,健保數(shù)據(jù)庫的公開和研究,造就了臺灣醫(yī)療水準(zhǔn)在這十幾年來突飛猛進(jìn)。


我經(jīng)常講因?yàn)橐粋€(gè)數(shù)據(jù)庫帶動了一個(gè)領(lǐng)域的成長,這個(gè)成長是關(guān)于到自己的健康。對于這個(gè)來講,臺灣現(xiàn)在跟大數(shù)據(jù)地理信息和影像方面的結(jié)合。我們公布區(qū)域資料之間的整合和人口結(jié)構(gòu),我們可以知道這個(gè)區(qū)域的醫(yī)療水準(zhǔn)夠不夠,醫(yī)療資源夠不夠。我們還可以知道遺傳病,臺灣最流行的疾病是臺南的登革熱,我們可以知道它的散布情況,當(dāng)年沒有大數(shù)據(jù)所以蔓延非常廣。我們可以知道疾病的蔓延跟疾病的防治,這些都很清楚。


所以在疾病的預(yù)防中,早期預(yù)防,早期醫(yī)療。我們跟上海的醫(yī)院合作,我們把臺灣的管理技術(shù)移植到上海、廈門、北京,目前在做這些事情。在醫(yī)療感知上有小米手環(huán),現(xiàn)在的小米手環(huán)就是看你睡的好不好而已。用臺灣的電腦數(shù)據(jù)庫建立一個(gè)模型,用來判斷睡眠狀況可能跟高血壓、抑郁癥這些都有關(guān)系,來看你整個(gè)睡眠狀態(tài)來判斷這些癥狀,現(xiàn)在我們在做這方面的模型,這樣的話戴小米手環(huán)的價(jià)值就更高了。小米手環(huán)的價(jià)格可能是一百塊,我的APP你咨詢一下可能就兩三塊,所以這是醫(yī)療云、健康云,用大數(shù)據(jù)平臺銜接起來,連門診、急診這些都在做。


現(xiàn)在很多人都在玩這個(gè),當(dāng)然你要進(jìn)來也可以。我們玩的是這一塊,最重要的是有數(shù)據(jù),有數(shù)據(jù)進(jìn)來以后才能有價(jià)值。所以大數(shù)據(jù)越來越重要,未來收集資料、整理資料、分析資料,你把這些資料放在手機(jī)里面,未來最重要的是數(shù)據(jù)。大家都有服務(wù),你把服務(wù)放在手機(jī)里面就是智能型的手機(jī)。我剛開始只是用模型,我們有太多的模型可以放在手機(jī)和電腦里面,我們醫(yī)療的價(jià)值就在這里,這才是商業(yè)智慧。


在這個(gè)過程中,我們產(chǎn)生的智慧在這里,產(chǎn)生的云在這里。你用手機(jī),你用不同的設(shè)備跟它接觸,這是一個(gè)革命時(shí)代的來臨。所以請大家注意,還是用臺灣的醫(yī)療大數(shù)據(jù)來告訴大家這是十年來的奇跡。大家到臺灣走一走,臺灣的醫(yī)療我不敢說是全世界第一,但是我至少敢說是世界領(lǐng)先的,臺灣的醫(yī)療水準(zhǔn)通過這個(gè)結(jié)構(gòu)帶動了臺灣的醫(yī)生在全世界是相當(dāng)有名的,所以醫(yī)療大數(shù)據(jù)是非常重要的。


科技風(fēng)云,再輝煌十年,別人都在說為什么十年。到2015年希望我們在座的每一個(gè),你所在的行業(yè)、企業(yè)或者是研究單位,如果你沒有在這個(gè)領(lǐng)域,就像馬云說的不參與這個(gè)一定埋怨,但是我加了一句話,不參與這個(gè)一定會后悔,一定會被淘汰。諾基亞說了一句話,我沒有做錯任何一件事情,我只是告訴你世界變化的太快了,我趕不上,我沒有找到那個(gè)定位。我們期待一個(gè)未來的智慧城市和智慧醫(yī)療,希望我們一起努力邁向大數(shù)據(jù)時(shí)代,我也希望跟大家一起工作,一起研究,一起合作,謝謝大家。




主持人:


謝謝謝教授,謝教授的演講給我三個(gè)感覺。第一個(gè)是特別幽默;第二個(gè)是他雖然不青春,但是他依然非常年輕。因?yàn)樗麜r(shí)時(shí)刻刻走在大數(shù)據(jù)世界的最前端。


PPT下載鏈接:http://bbs.pinggu.org/a-1875578.html


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }