
數(shù)據(jù)科學(xué)有很多很多定義,最基本的定義就是computer science,還有數(shù)學(xué)、統(tǒng)計(jì)、目標(biāo)、知識(shí),這是最基本的,再說(shuō)多了就過(guò)分了。一般對(duì)于年輕人來(lái)說(shuō),現(xiàn)在不可能到那么細(xì)的程度,我們應(yīng)該變成一個(gè)通才,哪個(gè)公司都愿意要我們。清華大學(xué)之所以現(xiàn)在變成這個(gè)樣子,就是因?yàn)樵?952年院系調(diào)整的時(shí)候,每一個(gè)專業(yè)就是一個(gè)生產(chǎn)線,弄的很細(xì)很細(xì),沒(méi)有一個(gè)更寬廣的視野。大數(shù)據(jù),所謂大就是這個(gè)樣子。數(shù)學(xué)關(guān)鍵是邏輯而不是具體的方法,不是你怎么求多項(xiàng)式的根,而是它的基本邏輯,它的數(shù)學(xué)語(yǔ)言,這一點(diǎn)要懂。數(shù)學(xué)邏輯是各種學(xué)科當(dāng)中最嚴(yán)格的邏輯,無(wú)論你學(xué)邏輯的,學(xué)物理的,學(xué)什么的,文科學(xué)邏輯的肯定是不如學(xué)物理的,學(xué)物理的邏輯肯定不如學(xué)數(shù)學(xué)的,所以你要跟學(xué)數(shù)學(xué)的辯論的話就很困難。文理分科造成沒(méi)有邏輯的文章,沒(méi)有邏輯的法官。
對(duì)那些高科技公司來(lái)說(shuō),數(shù)據(jù)科學(xué)家可以挖掘新的信息,幫助公司開(kāi)源節(jié)流。每個(gè)公司都是要這樣的,所以它需要的是人才,這是關(guān)鍵。我們說(shuō)數(shù)據(jù)科學(xué),當(dāng)然科學(xué)也有藝術(shù),這兩個(gè)都有關(guān)系??茖W(xué)意味著沒(méi)有權(quán)威,不要迷信那些權(quán)威,中國(guó)人喜歡崇拜權(quán)威。任何科學(xué)研究的目的是基于數(shù)據(jù),顛覆舊的理論,這樣才能往前進(jìn),所以你必須要有科學(xué)精神。
諾貝爾物理獎(jiǎng)沒(méi)有一個(gè)是承認(rèn)過(guò)去怎么樣的,而是推翻過(guò)去的事情,這是科學(xué),是顛覆性的。
如果你擅長(zhǎng)數(shù)學(xué),有很清晰的邏輯思維能力,有技能組合,就可能當(dāng)上數(shù)據(jù)科學(xué)家。投票顯示,數(shù)據(jù)分析和數(shù)據(jù)挖掘是最大的求職法寶。數(shù)據(jù)科學(xué)火爆的原因是,盡管高科技公司都有自己的數(shù)據(jù)科學(xué)團(tuán)隊(duì),但是那些非科技公司和很大的公司也需要做這些東西,他們需要能做這些東西的人?,F(xiàn)在關(guān)鍵是人,關(guān)鍵是你們?cè)趺礃幼屪约撼蔀楸恍枰娜恕?
另外,你是不是做數(shù)據(jù)科學(xué)家的材料?相比專長(zhǎng)于任何特定編程語(yǔ)言,泛型變成技巧更重要。最重要的素質(zhì)就是能快速學(xué)習(xí)東西。在這個(gè)時(shí)代技術(shù)發(fā)展的突飛猛進(jìn),語(yǔ)言很快會(huì)過(guò)時(shí),新的語(yǔ)言會(huì)迅速普及,所以學(xué)習(xí)東西快的人比單獨(dú)領(lǐng)域的專家更有前途,你有這個(gè)潛力你能干什么事。我要看你這個(gè)人的潛力,而不是你知道什么。知識(shí)再多你也超不過(guò)一個(gè)硬盤(pán)吧?但是硬盤(pán)沒(méi)有創(chuàng)造力。如果你每天花大量的時(shí)間編程,分析控制面板上的數(shù)據(jù),獲得相關(guān)知識(shí)和信息,如果你對(duì)這樣的工作感興趣你就適合干這行?,F(xiàn)在我沒(méi)事就處理編程數(shù)據(jù),我看了這個(gè)以后覺(jué)得自己有點(diǎn)像。如果僅僅是想拿高工資,那可能覺(jué)得這樣的日子就很苦了。實(shí)際上不光是這個(gè)工作,干任何工作,即使是坐牢你也要把它當(dāng)成樂(lè)趣。我有一個(gè)朋友,他就被上級(jí)陷害之類的坐牢了,現(xiàn)在坐牢很容易。他后來(lái)就跟我說(shuō),他覺(jué)得這件事情很享受,就是你怎么看這個(gè)問(wèn)題了。你要是發(fā)愁過(guò)一天也是一天,高高興興的過(guò)一天也是一天,所以你要考慮怎么活才合適。
真正適合干這一行的人,會(huì)在業(yè)余時(shí)間里編程序、分析數(shù)據(jù),他的目的就是自?shī)首詷?lè),而不是為了要拿著什么學(xué)位,拿到什么樣的頭銜,最終他自己把自己的價(jià)值就提高了。如果你愛(ài)的不是數(shù)據(jù)本身,而是它給你帶來(lái)的高薪,那你很難跟上來(lái)的人來(lái)競(jìng)爭(zhēng)了。要學(xué)會(huì)干一行愛(ài)一行,每個(gè)人都應(yīng)該學(xué)會(huì)熱愛(ài)數(shù)據(jù),即使是為了自己的事業(yè)前途也應(yīng)該這樣想,為了自己的心理也應(yīng)該這樣想。
還需要什么呢?我剛說(shuō)了,學(xué)習(xí)能力比知識(shí)更重要,歡迎挑戰(zhàn)、樂(lè)于攀登。如果沒(méi)有挑戰(zhàn)了,沒(méi)有古怪的數(shù)據(jù),我覺(jué)得很無(wú)聊,有點(diǎn)挑戰(zhàn)的我就很高興,我相信很多人都這樣,這樣活著才有意義,像豬一樣的活著沒(méi)有意義。你像富二代開(kāi)著寶馬到處飆車,他是找不到活著的意義啊,穿名牌什么的,是讓別人覺(jué)得你有點(diǎn)價(jià)值,實(shí)際上別人一看你更沒(méi)有價(jià)值了。馬克思的座右銘“懷疑一切”,在懷疑中成長(zhǎng),我們國(guó)家從來(lái)不倡導(dǎo)這個(gè),為什么咱們不宣傳這個(gè)?不要給自己貼標(biāo)簽,就是我學(xué)什么方向的,別的不搞,歲數(shù)大了,學(xué)不會(huì)了,很多人都有這樣的借口,這實(shí)際上是借口,我現(xiàn)在每天都在網(wǎng)上學(xué)東西,所以我現(xiàn)在教的東西總是新的,我的書(shū)一版再版,我現(xiàn)在大概寫(xiě)了有30本書(shū)了,為什么再版,因?yàn)槲野l(fā)現(xiàn)原來(lái)的有錯(cuò)或者不全面,我一定要把事情說(shuō)的更透徹一點(diǎn),說(shuō)的更好一點(diǎn)。
計(jì)算機(jī)最根本的就是領(lǐng)域知識(shí),你必須了解領(lǐng)域知識(shí),你才能夠知道該怎么做
如果你僅僅是一個(gè)干巴巴的統(tǒng)計(jì)學(xué)家,你不了解統(tǒng)計(jì),你可以做很多荒謬的事,不了解實(shí)際問(wèn)題。有一個(gè)例子,在醫(yī)學(xué)雜志發(fā)表的一個(gè)很有名的文章,說(shuō)如果父母在嬰兒房間內(nèi)睡覺(jué)總是開(kāi)著燈,嬰兒就會(huì)有高度近視。后來(lái)再發(fā)現(xiàn),凡是父母高度近視的,往往有給小孩開(kāi)燈的習(xí)慣。到底什么造成小孩高度近視,現(xiàn)在你們知道的,但是當(dāng)時(shí)的人不知道,所以要有很深刻的領(lǐng)域知識(shí),只有明白目標(biāo)領(lǐng)域知識(shí)的人才能明白它的意義,知道往哪個(gè)方向努力,去判斷分析結(jié)果的可能性。如果沒(méi)有領(lǐng)域知識(shí)主導(dǎo)的人分析肯定有誤導(dǎo),無(wú)論什么地位。在中國(guó)院士到哪兒都去發(fā)表理論,就像金正恩到哪兒都發(fā)表指示一樣。所以用數(shù)據(jù)來(lái)說(shuō)話,其他的一切都是廢話。我每年看到很多很多的文章,包括一些大賽,這個(gè)賽那個(gè)賽,好多都是莫名其妙的假定,就連31個(gè)省市自治區(qū)的數(shù)據(jù)都假設(shè)是正態(tài)分布,這31個(gè)省市自治區(qū)的就不是樣本,更不用說(shuō)是正態(tài)分布。
作為科學(xué)就這么多內(nèi)容,對(duì)年輕人來(lái)說(shuō)就是要明白這些基本的東西,太花哨的東西就沒(méi)意義了,那就是擴(kuò)展了也不是沒(méi)意義,不要鉆進(jìn)去出不來(lái)了。
你離得越遠(yuǎn)看得越清楚,站得越高了解的全局越好
不要太具體了,不要迷信這些炒作的新名詞、新概念,用自己的大腦,用常識(shí)判斷,想想合不合理。過(guò)去某個(gè)人的經(jīng)驗(yàn)是他的經(jīng)驗(yàn),不是你的經(jīng)驗(yàn),他在特定環(huán)境、特定時(shí)間有作用,但不是現(xiàn)在。如果你要跟風(fēng)就意味著永遠(yuǎn)是跟隨,也絕對(duì)不會(huì)有出息。 炒作沒(méi)人管,只要有觀眾給你鼓掌,觀眾回去一腦袋漿糊,但是每個(gè)人自己不能糊涂。第一原料就是數(shù)據(jù),什么是數(shù)據(jù)?照片都可以變成數(shù)據(jù)。
要有基于數(shù)據(jù)的批判性思維,而不是基于主觀經(jīng)驗(yàn)、權(quán)威或者是局部的知識(shí),也不是迎合取寵式的思維。在中國(guó)取寵思維很厲害,你說(shuō)GDP增加多少就是多少,這不是說(shuō)的,要有人做。工具就是剛才說(shuō)的能力加計(jì)算機(jī)系統(tǒng)加泛型。
個(gè)人還要有快速的自學(xué)能力和對(duì)數(shù)據(jù)分析的愛(ài)好
我從來(lái)沒(méi)學(xué)過(guò)計(jì)算機(jī),也沒(méi)學(xué)過(guò)計(jì)算機(jī)編程。英文都沒(méi)學(xué)過(guò),全都是自學(xué)的,所以我對(duì)自學(xué)很相信?,F(xiàn)在我教的東西都是最近這幾年的東西,我現(xiàn)在實(shí)際上比一個(gè)全職教師教的課還多,但是我教的東西好多都是前一天網(wǎng)上才出現(xiàn)的,我覺(jué)得有價(jià)值,第二天就放到課堂上了。只有不斷的自學(xué),不斷的學(xué)習(xí)才能當(dāng)老師。如果你不斷的跟學(xué)生演示80年前的推導(dǎo)過(guò)程,顯示你的記憶力好,那不是好老師。
什么人最快樂(lè)?被人需要,這是很重要的,就是你得有價(jià)值。因?yàn)槟愕膶iL(zhǎng)、能力、善良、尊重、愛(ài)心、品質(zhì)、性格、智力、分享。今天早上他們也講了,就是在公司里跟人家能相處,至少你得是可愛(ài)的。還要關(guān)心他人,能讓別人快樂(lè)的人是快樂(lè)的。如果買(mǎi)點(diǎn)東西在宿舍里藏在被窩里吃,那高興嗎?如果跟別人分享的話會(huì)更高興。尊敬別人的人是快樂(lè)的,一定要尊敬別人。如果大家都尊敬別人的話,社會(huì)上任何犯罪都沒(méi)有了,因?yàn)榉缸锒际峭?、搶、殺,侮辱別人這都是不尊敬別人的。誠(chéng)實(shí)坦蕩的人是快樂(lè)的,這就是不能撒謊,永遠(yuǎn)不能撒謊。還要心胸開(kāi)闊,不去計(jì)較一些小事情。最關(guān)鍵的就是愛(ài)人如己,你愛(ài)人不是因?yàn)樗軔?ài)你回來(lái),也不是因?yàn)樗蓯?ài),而是對(duì)任何事情都尊重,這是最根本的一點(diǎn)。如果這點(diǎn)你要做到了,如果人人都能做到,那世界就太理想了。不管怎么樣,我希望大家能夠快樂(lè)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03