
編者按:9月11日—9月12日,由經(jīng)管之家(原人大經(jīng)濟(jì)論壇)主辦的“2015中國(guó)數(shù)據(jù)分析師行業(yè)峰會(huì)(CDA?Summit)”在北京舉行。本文是臺(tái)北醫(yī)學(xué)大學(xué)教授謝邦昌在峰會(huì)上的演講全文,謝邦昌教授演講的主題是“大數(shù)據(jù)在生技醫(yī)療之應(yīng)用”。
各位嘉賓、各位先生、各位女士,大家早安!
很高興被稱(chēng)為老教授,實(shí)際上也很老了。聽(tīng)完吳院長(zhǎng)的一悉話,我今天所介紹的比較簡(jiǎn)單,在醫(yī)學(xué)領(lǐng)域大數(shù)據(jù)的應(yīng)用。我也希望能夠告訴大家大數(shù)據(jù)這幾年來(lái)它所發(fā)揮的作用。
剛剛吳院長(zhǎng)提到大數(shù)據(jù)在這方面的應(yīng)用,其實(shí)有一句話很重要。我們知道沒(méi)有人擁有所有的數(shù)據(jù),你怎么在既有的數(shù)據(jù)中間找到自己的數(shù)據(jù),這是最重要的。剛剛我跟吳院長(zhǎng)溝通一些事情,大家知道在大數(shù)據(jù)領(lǐng)域中,我們有三個(gè)領(lǐng)域,IaaS、SaaS、PaaS。在SaaS的大概99.99%,我們都不是IaaS、PaaS這個(gè)領(lǐng)域的人,但是現(xiàn)在很多人都在往IaaS、PaaS這里面走,我們應(yīng)該是SaaS里面的人。
大家想一想我講的這句話,在醫(yī)療大數(shù)據(jù)中間,我們看一下醫(yī)療未來(lái)的發(fā)展。其實(shí)科學(xué)精確描述這個(gè)世界,現(xiàn)在的生物學(xué)在越來(lái)越朝向?qū)嵶C科學(xué)走?,F(xiàn)在我們?cè)絹?lái)越多涉及到基因,為什么?我們要用大數(shù)據(jù)去解讀。所以在生命語(yǔ)言中間,心里我們?nèi)狈Φ氖橇私馍Z(yǔ)言。但是我們已經(jīng)有生命語(yǔ)言,我們不懂得生命語(yǔ)言的在哪里。
新的基因組定序,從植物、生物、微生物的定序,這方面的領(lǐng)域在各個(gè)方面占有很大的部分?,F(xiàn)在在很多領(lǐng)域研究,大數(shù)據(jù)里面60%都是在做健康這方面的研究。
關(guān)于人類(lèi)基因組,對(duì)我們大數(shù)據(jù)來(lái)講很多人都覺(jué)得是無(wú)字天書(shū)。雖然我是學(xué)這個(gè)專(zhuān)業(yè)的,我跟我太太看這個(gè),我可以從統(tǒng)計(jì)和大數(shù)據(jù)的角度向她解釋一些原因,這些是人類(lèi)基因。PM2.5跟你的健康有關(guān)系,跟你的基因有關(guān)系。甚至天氣、溫度會(huì)跟你的血壓和相關(guān)的健康狀況有關(guān)系。從Genes到Biochemical,最難的是我們?cè)趺窗褦?shù)據(jù)加以整合和分析找出有用的信息。所以基因跟疾病之間的關(guān)系,有家族遺傳的關(guān)系。我們不知道這個(gè)病是什么樣的,我們要了解遺傳,我們要知道基因。
還有基因跟環(huán)境之間的交互,我有一次到北京來(lái)流鼻涕就好了,但是到臺(tái)北鼻涕一直有,你怎么把這兩個(gè)因素中間的數(shù)據(jù)找出來(lái)?;蛲蛔兣c癌癥之間的變化,他的家族病史告訴他,他可以從一些數(shù)據(jù)中找出原因,用大數(shù)據(jù)協(xié)助來(lái)做這件事情。所以在這些控制中間,我們?cè)絹?lái)越了解病因。
從大數(shù)據(jù)中間我們可以產(chǎn)生分子級(jí)的斷命家,這個(gè)已經(jīng)不是天方夜譚了,他可以依照你個(gè)人特質(zhì)化的基因來(lái)治療。未來(lái)是什么樣的,可不可以有干細(xì)胞產(chǎn)生某項(xiàng)器官,把你的藥效帶到心臟、血管任何的定位。這些東西是不是對(duì)人有用,是有用的,但是大數(shù)據(jù)怎么分析出這些東西。
有一些人研究干細(xì)胞的,結(jié)果發(fā)現(xiàn)干細(xì)胞存在人類(lèi)身體所有的部分。尤其是第二大部分是這塊,你的脂肪里面的干細(xì)胞是最多的。特別是研究心臟和肺等等,對(duì)干細(xì)胞的研究我們一直在進(jìn)行,對(duì)干細(xì)胞的修復(fù)也是沒(méi)有問(wèn)題的。還有就是納米技術(shù),這里面需要太多大數(shù)據(jù)的應(yīng)用了。
最后是無(wú)聲的殺手人類(lèi)與微生物的戰(zhàn)爭(zhēng),剛剛教授講到了流感的預(yù)測(cè),很重要的是細(xì)菌不斷的演化,演化的速度比你預(yù)測(cè)的速度還要快。
大家可以知道在醫(yī)學(xué)上面的挑戰(zhàn)剛開(kāi)始,它跟大數(shù)據(jù)的結(jié)合現(xiàn)在如火如荼的在做,我今年2月才轉(zhuǎn)到大數(shù)據(jù),我們需要做的就是這些整合。在這個(gè)情況下,今天跟大家談到的是所謂的大數(shù)據(jù)在醫(yī)療上的應(yīng)用。
其實(shí)剛才吳教授講過(guò)了,我請(qǐng)大家記住四個(gè)英文單詞SMAC(Social、Mobile、Analytics和Cloud),實(shí)際上手機(jī)和任何分析速度運(yùn)算來(lái)月快,請(qǐng)大家記住這四張圖形,Science一定告訴你data,時(shí)代雜志告訴你2045年那些事情,因?yàn)槿祟?lèi)會(huì)變成不朽,你相不相信這件事情,最后這件事情又引申了2045這件事情。
在2012年5月做了一個(gè)實(shí)驗(yàn),誰(shuí)比較聰明,Warse最聰明,它是世界上益智賽觀者。大家回想十幾年前有一個(gè)深藍(lán),它贏了誰(shuí)?贏了前蘇聯(lián)的棋王。告訴你,以后玩象棋游戲電腦陪你玩兒,這就叫電玩時(shí)代的來(lái)臨。這個(gè)就是人工智慧時(shí)代的來(lái)臨。大家手邊拿著一個(gè)手機(jī)叫智能手機(jī)。你以后家里的很多都冠上智能。連大數(shù)據(jù)都可以辦世界博覽會(huì),我們?cè)麻L(zhǎng)也在場(chǎng)。世界博覽會(huì)(2015貴陽(yáng)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)),大家知道世界各大咖都集中在那。
我想說(shuō)臺(tái)灣做的一件事比較好的,叫開(kāi)放Data,政府在各方面的數(shù)據(jù)能公布的很多都能公布。我們所有的財(cái)政,電子發(fā)票等等這些,很有研究興趣的。還有健保資料部能公布的都能公布,然后加以整合,但是個(gè)人隱私的都不會(huì)公布。政府愿意公布這些材料說(shuō)明政府開(kāi)放出來(lái),所以這件事情也很重要。中國(guó)政府現(xiàn)在重要的一件事情是怎么公布數(shù)據(jù)資料,雖然做了但是還是不夠。
馬云在5月的時(shí)候說(shuō)的這句話,就是IT時(shí)代把人變成了機(jī)器,但是DT時(shí)代讓機(jī)器越來(lái)越接近人,越來(lái)越接近人的智慧?,F(xiàn)在DT時(shí)代來(lái)臨不代表IT不重要,它還很重要,我們?cè)谧?9%的人大概都不是做Ass這塊,我們是做Saas這塊。速度越來(lái)越快,需求量越來(lái)越大,代表著云計(jì)算時(shí)代的來(lái)臨。所以不必?fù)?dān)心有這些種種,不見(jiàn)得每個(gè)人都建Data中心,該做什么的做什么,我們是要做解決方案的人。
記得,我現(xiàn)在看到很多都教育你怎么跳個(gè)層次,跳到里怎么找Data做這方面,No Data記得這些事情。我不是說(shuō)這塊不重要,但是這塊相當(dāng)成熟了,這塊你讓該做的人做,大數(shù)據(jù)應(yīng)用很簡(jiǎn)單的一句話,就是Data是什么。所以大忽悠麥肯錫忽悠大數(shù)據(jù),其實(shí)它之前就有了,但是忽悠的非常好。所以看大數(shù)據(jù)組織,聯(lián)合國(guó)組織,看看大家都在玩了,中國(guó)政府一看,再看美國(guó)白皮書(shū),我該玩兒大數(shù)據(jù)了,所以2012年應(yīng)該是中國(guó)進(jìn)入大數(shù)據(jù)的元年,當(dāng)然中國(guó)跑的比誰(shuí)都快,今年又辦了一個(gè)大數(shù)據(jù)的峰會(huì)。所以最重要的告訴大家,它提的大數(shù)據(jù)宣言,100多個(gè)國(guó)家,40多個(gè)企業(yè)提這個(gè)宣言的意義在哪里?我要定數(shù)據(jù)的規(guī)格,這是有真知灼見(jiàn)的。所以海峽兩岸的大咖都在這里。
大家可以看到在未來(lái)十年電腦的智慧,現(xiàn)在是老鼠,未來(lái)十年大概會(huì)接近人腦。所以剛剛已經(jīng)講過(guò)這個(gè)了,就是大數(shù)據(jù)的整合,剛剛吳院長(zhǎng)說(shuō)的就是Crisp的過(guò)程。我剛剛講過(guò),以往來(lái)講這些分析方法什么的要用很多算法,像oracle等等都已經(jīng)把這些買(mǎi)下來(lái)了,這樣方法都有了,而且很簡(jiǎn)單很快速。我剛才講了C+、R等等都有了,現(xiàn)在是解決方案的天下。我很快可以找到這個(gè)結(jié)果,我之所以用電腦是要證明給大家看,我簡(jiǎn)單秀一下,大家就明白了。
這一張可以處理幾百萬(wàn)的資料,假設(shè)在座的中小企業(yè)大概一兩百萬(wàn)的資料,你用Excel就可以處理掉了。我剛才說(shuō)做Guesting,我們這里有數(shù)據(jù)挖掘的預(yù)測(cè),你要做預(yù)測(cè),然后就是下一步,一步一步這樣下來(lái),我就不一一講了。我要預(yù)測(cè)這三個(gè)地方的銷(xiāo)售量,我直接完成,完成之后,我們模型就直接出來(lái)了。大家可以看到,這是它的預(yù)測(cè)值就出來(lái)了,當(dāng)然它有它的模型。以這個(gè)來(lái)講,我們剛才講的也一樣。我想這些東西大家也都會(huì)。首先我就可以很快的做這些,剛剛吳院長(zhǎng)講到的這些觀念。
很重要的是,我要看銷(xiāo)售的預(yù)測(cè),要看它之間的關(guān)聯(lián)性,找到你買(mǎi)它們之間的關(guān)系。以這個(gè)來(lái)講一樣,我可以很快的找到,你今天購(gòu)買(mǎi)的行為中間你會(huì)有哪些之間的結(jié)構(gòu)關(guān)系,然后你可以找到你買(mǎi)它們之間的結(jié)構(gòu)關(guān)系。剛才是幾萬(wàn)的資料,買(mǎi)這個(gè)就可以知道其中的結(jié)構(gòu)關(guān)系。開(kāi)始的秀只是為了證明,是你怎么找到這些資料,這些資料你能不能得到,你不能得到的話,你做分析資料,我剛才說(shuō)No Data,你有再好的技術(shù)都是空的,但是現(xiàn)在大家都在賣(mài)產(chǎn)值給你,你沒(méi)有Data,什么都是枉費(fèi)的。所以百度可以做世界杯和任何的預(yù)測(cè),所以未來(lái)是以Data為核心的生活。我們現(xiàn)在以大數(shù)據(jù)做一個(gè)分析,因?yàn)閮砂冬F(xiàn)在青少年問(wèn)題越來(lái)越嚴(yán)重,我們警察局結(jié)合了教育部,結(jié)合它們的很多大數(shù)據(jù)分析,第一個(gè),先分析青少年常上網(wǎng)站的增量,然后找到之間的關(guān)聯(lián)性,找到這些關(guān)聯(lián)性之后就是語(yǔ)義分析,然后找出它的主題。我們看這些主題的監(jiān)管的知識(shí),我們要做哪些事情?電子足跡,跟蹤這些,去輔導(dǎo)這些青少年。所以根據(jù)這些電子足跡,大家看到臺(tái)灣的青少年網(wǎng)站是Facebook等,我們可以很快找到這些,可以知道哪些要注意,還有領(lǐng)頭的意見(jiàn)領(lǐng)袖是誰(shuí),這其中就能看到相關(guān)性種種的,然后協(xié)助他們做毒品輔導(dǎo)之類(lèi)的。電子足跡進(jìn)去后鎖定,然后找出毒品的來(lái)源,還有建立毒品的DNA,再建立大的數(shù)據(jù)庫(kù)。
這個(gè)跟我們五年前我們跟調(diào)查局做的一件事情,大家看這也是雜七雜八的,我們調(diào)查一個(gè)人,那個(gè)是毒犯判了進(jìn)了牢里后的記錄,這個(gè)記錄很復(fù)雜,這就是一個(gè)購(gòu)買(mǎi)行為,這是他跟各類(lèi)人的聯(lián)絡(luò),馬上就清楚的勾勒出來(lái),勾勒出來(lái)之后結(jié)合兩岸的刑事警察局破獲了東南亞一個(gè)毒網(wǎng),這就是大數(shù)據(jù)的簡(jiǎn)單應(yīng)用。沒(méi)有這些數(shù)據(jù),更多的應(yīng)用也沒(méi)用。
資料還可以用在治安,用在暴力犯罪預(yù)測(cè),哪里的暴力犯罪最多,這個(gè)美國(guó)已經(jīng)在做了,這個(gè)可以用在大數(shù)據(jù)的數(shù)據(jù)的整合。臺(tái)灣有一個(gè)總體的資料庫(kù),大家了解臺(tái)灣進(jìn)總體資料庫(kù)有很多是開(kāi)放的,你可以看一看整個(gè)結(jié)構(gòu)。大陸我們協(xié)助過(guò)統(tǒng)計(jì)局做數(shù)據(jù)平臺(tái),國(guó)家數(shù)據(jù),但是這些數(shù)據(jù)的開(kāi)放性還不夠,同時(shí)也懷疑這些數(shù)據(jù)的準(zhǔn)確性,這些都是值得加強(qiáng)的,我就不再講了。
現(xiàn)在數(shù)據(jù)的整合越來(lái)越重要,DataTime已經(jīng)上新三板了,數(shù)據(jù)模仿。我們現(xiàn)在在做哪些事情?我在北醫(yī),我們?cè)瓉?lái)做的有點(diǎn)像這件事情,這個(gè)我已經(jīng)向各位報(bào)告過(guò)了。我們現(xiàn)在做了三個(gè):醫(yī)療云、健康云,照顧云,走在大數(shù)據(jù)上。這三個(gè)云最重要的,臺(tái)灣叫健康保險(xiǎn),這里叫醫(yī)保數(shù)據(jù)庫(kù)。醫(yī)保數(shù)據(jù)庫(kù),假如有信息化,你們可以進(jìn)去,因?yàn)檫@是開(kāi)放的,但是需要申請(qǐng),這里有不同的申請(qǐng),它會(huì)教你怎么開(kāi)放。這些東西怎么去串這些數(shù)據(jù)庫(kù)。所以你要有串?dāng)?shù)據(jù)庫(kù),整合數(shù)據(jù)庫(kù)的能力,你要想怎么用Saas把這些數(shù)據(jù)庫(kù)整合出來(lái),了解心臟病到底用什么藥。像剛剛講的乳癌,這個(gè)人家怎么做的,都可以清清楚楚知道,然后再來(lái)重大傷病,還有住院,醫(yī)療這些,清清楚楚的這些資料都可以開(kāi)放,但是個(gè)人資料都沒(méi)有開(kāi)放。
我們現(xiàn)在做的一件事情,我們有五家醫(yī)院,還有些一中心,我們將醫(yī)保、健保數(shù)據(jù)庫(kù)加以整合,能不能跟生活形態(tài),跟你的運(yùn)動(dòng),跟人類(lèi)的生活形態(tài),甚至基因等加以整合,整合完以后數(shù)據(jù)處理,數(shù)據(jù)分析,它會(huì)產(chǎn)生什么樣的價(jià)值向各位報(bào)告,臺(tái)灣15年下來(lái)產(chǎn)生了有頂級(jí)影響力的研究報(bào)告。所以造就了這兩年來(lái),你可以看到很多數(shù)據(jù),經(jīng)濟(jì)學(xué)人在今年公布了臺(tái)灣是宜居城市,臺(tái)灣的醫(yī)療在全世界是第三,亞洲第一,健保數(shù)據(jù)庫(kù)的公開(kāi)和研究,造就了臺(tái)灣醫(yī)療水準(zhǔn)在這十幾年來(lái)突飛猛進(jìn)。
我經(jīng)常講因?yàn)橐粋€(gè)數(shù)據(jù)庫(kù)帶動(dòng)了一個(gè)領(lǐng)域的成長(zhǎng),這個(gè)成長(zhǎng)是關(guān)于到自己的健康。對(duì)于這個(gè)來(lái)講,臺(tái)灣現(xiàn)在跟大數(shù)據(jù)地理信息和影像方面的結(jié)合。我們公布區(qū)域資料之間的整合和人口結(jié)構(gòu),我們可以知道這個(gè)區(qū)域的醫(yī)療水準(zhǔn)夠不夠,醫(yī)療資源夠不夠。我們還可以知道遺傳病,臺(tái)灣最流行的疾病是臺(tái)南的登革熱,我們可以知道它的散布情況,當(dāng)年沒(méi)有大數(shù)據(jù)所以蔓延非常廣。我們可以知道疾病的蔓延跟疾病的防治,這些都很清楚。
所以在疾病的預(yù)防中,早期預(yù)防,早期醫(yī)療。我們跟上海的醫(yī)院合作,我們把臺(tái)灣的管理技術(shù)移植到上海、廈門(mén)、北京,目前在做這些事情。在醫(yī)療感知上有小米手環(huán),現(xiàn)在的小米手環(huán)就是看你睡的好不好而已。用臺(tái)灣的電腦數(shù)據(jù)庫(kù)建立一個(gè)模型,用來(lái)判斷睡眠狀況可能跟高血壓、抑郁癥這些都有關(guān)系,來(lái)看你整個(gè)睡眠狀態(tài)來(lái)判斷這些癥狀,現(xiàn)在我們?cè)谧鲞@方面的模型,這樣的話戴小米手環(huán)的價(jià)值就更高了。小米手環(huán)的價(jià)格可能是一百塊,我的APP你咨詢(xún)一下可能就兩三塊,所以這是醫(yī)療云、健康云,用大數(shù)據(jù)平臺(tái)銜接起來(lái),連門(mén)診、急診這些都在做。
現(xiàn)在很多人都在玩這個(gè),當(dāng)然你要進(jìn)來(lái)也可以。我們玩的是這一塊,最重要的是有數(shù)據(jù),有數(shù)據(jù)進(jìn)來(lái)以后才能有價(jià)值。所以大數(shù)據(jù)越來(lái)越重要,未來(lái)收集資料、整理資料、分析資料,你把這些資料放在手機(jī)里面,未來(lái)最重要的是數(shù)據(jù)。大家都有服務(wù),你把服務(wù)放在手機(jī)里面就是智能型的手機(jī)。我剛開(kāi)始只是用模型,我們有太多的模型可以放在手機(jī)和電腦里面,我們醫(yī)療的價(jià)值就在這里,這才是商業(yè)智慧。
在這個(gè)過(guò)程中,我們產(chǎn)生的智慧在這里,產(chǎn)生的云在這里。你用手機(jī),你用不同的設(shè)備跟它接觸,這是一個(gè)革命時(shí)代的來(lái)臨。所以請(qǐng)大家注意,還是用臺(tái)灣的醫(yī)療大數(shù)據(jù)來(lái)告訴大家這是十年來(lái)的奇跡。大家到臺(tái)灣走一走,臺(tái)灣的醫(yī)療我不敢說(shuō)是全世界第一,但是我至少敢說(shuō)是世界領(lǐng)先的,臺(tái)灣的醫(yī)療水準(zhǔn)通過(guò)這個(gè)結(jié)構(gòu)帶動(dòng)了臺(tái)灣的醫(yī)生在全世界是相當(dāng)有名的,所以醫(yī)療大數(shù)據(jù)是非常重要的。
科技風(fēng)云,再輝煌十年,別人都在說(shuō)為什么十年。到2015年希望我們?cè)谧拿恳粋€(gè),你所在的行業(yè)、企業(yè)或者是研究單位,如果你沒(méi)有在這個(gè)領(lǐng)域,就像馬云說(shuō)的不參與這個(gè)一定埋怨,但是我加了一句話,不參與這個(gè)一定會(huì)后悔,一定會(huì)被淘汰。諾基亞說(shuō)了一句話,我沒(méi)有做錯(cuò)任何一件事情,我只是告訴你世界變化的太快了,我趕不上,我沒(méi)有找到那個(gè)定位。我們期待一個(gè)未來(lái)的智慧城市和智慧醫(yī)療,希望我們一起努力邁向大數(shù)據(jù)時(shí)代,我也希望跟大家一起工作,一起研究,一起合作,謝謝大家。
主持人:
謝謝謝教授,謝教授的演講給我三個(gè)感覺(jué)。第一個(gè)是特別幽默;第二個(gè)是他雖然不青春,但是他依然非常年輕。因?yàn)樗麜r(shí)時(shí)刻刻走在大數(shù)據(jù)世界的最前端。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10