
大數(shù)據(jù)時代,你確定你是一名合格的數(shù)據(jù)分析師嗎
大數(shù)據(jù)時代到來,如何從數(shù)據(jù)中提取、挖掘?qū)I(yè)務(wù)發(fā)展有價值的、潛在的知識,為決策層的提供有力依據(jù),為產(chǎn)品或服務(wù)發(fā)展方向起到積極作用,有力推動企業(yè)管理的精益化,對于每個企業(yè)都意義重大,而這些工作,大多需要數(shù)據(jù)分析師才能完成,但如何才能成為一個合格的數(shù)據(jù)分析師呢?
我這里提四個方面,如果你是一個新手,想從事數(shù)據(jù)分析師這個職業(yè),那么,你可以看看,當(dāng)然如果你是個分析老鳥,在苦惱如何更進一步,也可以看下,可能于你也有益哦,數(shù)據(jù)分析師學(xué)無止境,總在痛并快樂著。 Part 1 數(shù)據(jù)分析師的基本素質(zhì) 數(shù)據(jù)分析師最需要的基本素質(zhì)是什么,很多人會回答,不是要統(tǒng)計學(xué)知識嗎,不是要會一些工具嗎,說得對,也不對,統(tǒng)計學(xué)等只是數(shù)據(jù)分析的術(shù),而我更強調(diào)的卻是道,做好數(shù)據(jù)分析與寫詩文一樣,真正的關(guān)鍵在技巧之外,即業(yè)務(wù)能力、思考能力及溝通能力三樣,這些能力很多人天生就有,而很多人需要艱苦的訓(xùn)練獲得,甚至訓(xùn)練也不可得。
業(yè)務(wù)能力
不要聽什么數(shù)據(jù)分析速成的教程,任何有經(jīng)驗的數(shù)據(jù)分析師對此都會嗤之以鼻,要成為數(shù)據(jù)分析師,沒個3年下不來,當(dāng)然具體周期依賴于公司業(yè)務(wù)的復(fù)雜程度。只要真的在實踐領(lǐng)域從事過數(shù)據(jù)分析工作,就會明白所有分析的重中之重都是業(yè)務(wù)知識本身。而業(yè)務(wù)知識的學(xué)習(xí)和掌握,需要的積累之深,培養(yǎng)一個業(yè)務(wù)專家,需要的周期之長,都遠遠超過后面所說的那些基本技能,成為業(yè)務(wù)專家實屬不易,數(shù)據(jù)分析師其實是之于業(yè)務(wù)專家之上的更深層次的思考和總結(jié),否則,誰指導(dǎo)誰都是個問題。業(yè)務(wù)學(xué)習(xí)的方式很多,比如將以前的分析報告和取數(shù)案例都拿過來研究一下,不懂就問,總是一個漸進的過程,但需要時間和行業(yè)的沉淀。數(shù)據(jù)分析師最需要不斷提升的能力就是行業(yè)和業(yè)務(wù)知識,沒有之一。
思考能力
數(shù)據(jù)總是在那里,它不會說話,你不僅要基于業(yè)務(wù)能力理解它,還要學(xué)會推演和分析,從中發(fā)現(xiàn)規(guī)律,迅速定位某個商業(yè)問題的關(guān)鍵屬性和決定因素,形成自己獨創(chuàng)性的見解,所謂心思縝密,滴水不漏,沒有思考邏輯沒有數(shù)據(jù)分析。而要形成獨特的見解,則來自于個人不斷的學(xué)習(xí)和思考,這里的學(xué)習(xí)更多的強調(diào)是跨領(lǐng)域和專業(yè),思考則更多的強調(diào)養(yǎng)成思考的習(xí)慣。
跨領(lǐng)域的的知識會給人帶來不同的思維方式和看問題的角度,每學(xué)習(xí)一個新的領(lǐng)域,相當(dāng)于打開了一扇全新看世界的門,很多企業(yè)經(jīng)常花重金請咨詢公司幫忙做一些分析報告(當(dāng)前咨詢分析不再像以前吃香,不是企業(yè)不需要,而是他們也需要與時俱進),是有其原因的,企業(yè)往往看重咨詢公司廣闊的分析思路和全局的視野,比如經(jīng)常提的最佳實踐。在各個跨領(lǐng)域?qū)I(yè)中,經(jīng)濟學(xué)、心理學(xué)、統(tǒng)計學(xué)等對于數(shù)據(jù)分析的輔助又最強。
另一個思考能力是養(yǎng)成思考的習(xí)慣,所謂“學(xué)而不思則罔,思而不學(xué)則殆”。思考本身是一種實踐,它可以將你的知識更加系統(tǒng)化和深入化,數(shù)據(jù)分析一定程度上是用來驗證思路和啟發(fā)靈感的,“數(shù)據(jù)分析”從來不是“數(shù)據(jù)分析”本身,而是以“數(shù)據(jù)分析”為手段和表象,對業(yè)務(wù)的深刻理解、思考和判斷。
溝通能力
數(shù)據(jù)分析貫穿BIT、數(shù)據(jù)、技術(shù)、業(yè)務(wù)整個鏈條,數(shù)據(jù)分析師將BIT最終轉(zhuǎn)化成決策者理解的語言,跨越的流程很長,你需要面對不同的崗位,碰到不同的角色,采用不同的語言,表達你的要求和獲得你需要的東西,成為數(shù)據(jù)和業(yè)務(wù)的橋梁,沒有足夠的溝通能力很難。所謂上得了臺面,下得了廳堂。同時,大腦很多時候是非理性的,但如果你容易聽取他人的意見,特別是智者的意見,則可以幫你找到另一條出路,你犯錯的概率就會降低,相應(yīng)的,你的分析就更有力量和說服力
從這個角度講,企業(yè)的管理者實際是最強的數(shù)據(jù)分析師,這個毋容置疑哦。數(shù)據(jù)分析師道的養(yǎng)成,絕非一日之功。
Part 2 數(shù)據(jù)分析師的養(yǎng)成課程 除了數(shù)據(jù)分析的道,再來講講數(shù)據(jù)分析的術(shù),即工具和手段,如果你進入了一個企業(yè),希望盡快成長為一個數(shù)據(jù)分析師,還需要在以下4個方面加強學(xué)習(xí),當(dāng)然僅供參考,不用盡信,筆者相信每個人都需要形成自己的學(xué)習(xí)軌跡,不需要照搬它人:
數(shù)據(jù)學(xué)習(xí)
業(yè)務(wù)學(xué)習(xí)有一個毛病,比如你看案例,往往接觸到的數(shù)據(jù)或使用的數(shù)據(jù)是局部的,因此,你的視野會受局限,在大多數(shù)公司里,很多數(shù)據(jù)分析師其實缺乏全局的數(shù)據(jù)視野,因為他不知道到底有多少數(shù)據(jù),因此,永遠只能在已知的數(shù)據(jù)里轉(zhuǎn)圈圈,當(dāng)然,可能也夠了,但我這里要說得是做得最好。
數(shù)據(jù)分析師應(yīng)該主動的向IT部門拿到最全的數(shù)據(jù)字典,對于數(shù)據(jù)字典進行持續(xù)的學(xué)習(xí),了解每張表甚至字段的業(yè)務(wù)含義,理解的越透徹,你的分析潛力就越大。更有甚者,筆者還建議你去理解源系統(tǒng),從業(yè)務(wù)實現(xiàn)流程角度出發(fā)去理解對應(yīng)數(shù)據(jù)的含義,因為有時候,簡單的業(yè)務(wù)描述在數(shù)據(jù)上的表達卻是非常復(fù)雜的,業(yè)務(wù)語言與數(shù)據(jù)語言很多時候是1對多關(guān)系,打個比方,你看到業(yè)務(wù)系統(tǒng)上某個菜單的功能,對應(yīng)到系統(tǒng)中的數(shù)據(jù)是怎樣的,你能還原出來嗎?
當(dāng)然,大多數(shù)數(shù)據(jù)分析師可能不需要進行系統(tǒng)數(shù)據(jù)學(xué)習(xí),反正實踐中慢慢熟悉好了,但自頂向下的數(shù)據(jù)學(xué)習(xí)方式可以讓你有一個更好的基礎(chǔ)和更全局的數(shù)據(jù)視野。
技術(shù)學(xué)習(xí)
有幾個層面的東西要學(xué),依賴于實際的場景和你希望達到的階段:
首先,你要學(xué)會從數(shù)據(jù)庫或者其它源頭獲取數(shù)據(jù),很多數(shù)據(jù)分析師仍然依賴于IT人員獲取數(shù)據(jù),但大數(shù)據(jù)時代,真的有必要自己動手了,因為依賴他人效率太低了,起碼你要會SQL,SQL甚至基本上是為統(tǒng)計取數(shù)而生的方便工具,圖形化的透視方式也遠遠沒有SQL的表達能力強,這是基本功,其實, SQL就能解決大多數(shù)統(tǒng)計取數(shù)問題。
其次,你要會一些數(shù)據(jù)分析工具,EXCEL是最基本的,其實大多數(shù)數(shù)據(jù)分析基于EXCEL應(yīng)付已經(jīng)綽綽有余了,EXCEL的圖形表達能力也已經(jīng)夠強。
最后,如果你希望更深一層,那就學(xué)習(xí)R語言、PYTHON、SPSS,SAS等,他們提供了更強大的挖掘能力,可以幫你把統(tǒng)計學(xué)的數(shù)據(jù)挖掘精髓發(fā)揮的淋漓盡致。
當(dāng)然,如果有可能,你也要熟悉一下你所在企業(yè)的數(shù)據(jù)倉庫或大數(shù)據(jù)平臺,懂得一些基本的操作,對于你提升分析的自由度和靈活性也大有好處,比如自己搞個腳本定時跑數(shù)據(jù),打造個人的數(shù)據(jù)集市,現(xiàn)在數(shù)據(jù)分析的概念也越來越大,很多公司把對于大數(shù)據(jù)平臺的數(shù)據(jù)處理能力也納入到數(shù)據(jù)分析師的技能范疇。
以上層層遞推,其實數(shù)據(jù)分析師每在IT上前進一步,帶來的效益是幾何級的,比如你懂Hadoop,那么,你就可能離大數(shù)據(jù)更近一點。
統(tǒng)計理論
終于講到大家都很關(guān)心的統(tǒng)計學(xué)知識了,推薦一些書吧:
《深入淺出數(shù)據(jù)分析》:講了數(shù)據(jù)分析到底是干什么的?數(shù)據(jù)分析都包含什么內(nèi)容?對新人們還是有一定的作用,難度容易。
《深入淺出統(tǒng)計學(xué)》:要了解常用數(shù)理統(tǒng)計模型(描述統(tǒng)計指標(biāo)、聚類、決策樹、貝葉斯分類、回歸等),重點放在學(xué)習(xí)模型的工作原理、輸入內(nèi)容和輸出內(nèi)容,至于具體的數(shù)學(xué)推導(dǎo),學(xué)不會可暫放一邊,難度容易。
《極簡統(tǒng)計學(xué)》:對統(tǒng)計推斷部分的闡述十分清晰,適合非統(tǒng)計背景的人工閱讀。
《統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論》:簡明精要,統(tǒng)計概念和R可以一起學(xué)習(xí)。
《數(shù)據(jù)挖掘導(dǎo)論》:最近幾年數(shù)據(jù)挖掘教材中比較好的一本書,被美國諸多大學(xué)的數(shù)據(jù)挖掘課作為教材,筆者也最近買的,很好,很多概念解釋的比較清楚,難度中上。
《統(tǒng)計學(xué)習(xí)方法》:李航老師的扛鼎之作,難度難。
這些都是很實用的書籍,但結(jié)合了實踐學(xué)更好,對于特定的業(yè)務(wù)場景,就找對應(yīng)的書看吧,網(wǎng)上推薦的也很多了,大家自己搜索。
表達能力
作為數(shù)據(jù)分析人員,PPT制作能力是極其重要的一項能力,你總要通過某種形式表達出你的觀點,很核心的一點是需要有嚴(yán)密的邏輯,甚至滴水不漏,可以通過思維導(dǎo)圖來訓(xùn)練自己,但實際的格式表達卻有點八股,一般都是現(xiàn)狀分析,原因剖析、分析結(jié)論和后續(xù)措施啥的,萬變不離其宗,當(dāng)然你需要花一點時間來了解如何做重點突出,如何圖文并茂,PPT的寫作決非一日之功。
Part 3 數(shù)據(jù)分析師的學(xué)習(xí)計劃 下面是我以前研究的一個新人學(xué)習(xí)計劃表,供參考。
當(dāng)然也需要定期對學(xué)習(xí)成果進行檢查
Part 4 數(shù)據(jù)分析師的實踐 當(dāng)然最重要的永遠是實踐,成為數(shù)據(jù)分析師最好的方式就是完成一個項目,如果有個老師就太好了,經(jīng)過實踐獲得的知識才是你的,數(shù)據(jù)分析能力只能在實踐的熔爐中提升、升華,永遠問自己:
1、做過多少個分析或項目?
2、涉及多少業(yè)務(wù)場景?
3、做過多少種類型的模型?
4、基于模型做過多少次完整的marketing閉環(huán)?
5、到底你的分析為企業(yè)帶來了多大的實際價值?
以上五個問題,足以秒殺大多的忽悠和菜鳥了。
最后,再推薦一本科學(xué)技術(shù)思維的書,也是我最近看完的吳軍的《數(shù)學(xué)之美》,其科普了部分模型,有利于克服數(shù)學(xué)恐懼,其實從本原出發(fā),數(shù)學(xué)和統(tǒng)計并不是那么的枯燥,傳統(tǒng)教育真要反思哦。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03