
數(shù)據(jù)分析師的自我修養(yǎng)
大數(shù)據(jù)時代到來,如何從數(shù)據(jù)中提取、挖掘?qū)I(yè)務發(fā)展有價值的、潛在的知識,為決策層的提供有力依據(jù),為產(chǎn)品或服務發(fā)展方向起到積極作用,有力推動企業(yè)管理的精益化,對于每個企業(yè)都意義重大,而這些工作,大多需要數(shù)據(jù)分析師才能完成,但如何才能成為一個合格的數(shù)據(jù)分析師呢?
我這里提四個方面,如果你是一個新手,想從事數(shù)據(jù)分析師這個職業(yè),那么,你可以看看,當然如果你是個分析老鳥,在苦惱如何更進一步,也可以看下,可能于你也有益哦,數(shù)據(jù)分析師學無止境,總在痛并快樂著。
Part 1
數(shù)據(jù)分析師的基本素質(zhì)
數(shù)據(jù)分析師最需要的基本素質(zhì)是什么,很多人會回答,不是要統(tǒng)計學知識嗎,不是要會一些工具嗎,說得對,也不對,統(tǒng)計學等只是數(shù)據(jù)分析的術,而我更強調(diào)的卻是道,做好數(shù)據(jù)分析與寫詩文一樣,真正的關鍵在技巧之外,即業(yè)務能力、思考能力及溝通能力三樣,這些能力很多人天生就有,而很多人需要艱苦的訓練獲得,甚至訓練也不可得。
不要聽什么數(shù)據(jù)分析速成的教程,任何有經(jīng)驗的數(shù)據(jù)分析師對此都會嗤之以鼻,要成為數(shù)據(jù)分析師,沒個3年下不來,當然具體周期依賴于公司業(yè)務的復雜程度。只要真的在實踐領域從事過數(shù)據(jù)分析工作,就會明白所有分析的重中之重都是業(yè)務知識本身。而業(yè)務知識的學習和掌握,需要的積累之深,培養(yǎng)一個業(yè)務專家,需要的周期之長,都遠遠超過后面所說的那些基本技能,成為業(yè)務專家實屬不易,數(shù)據(jù)分析師其實是之于業(yè)務專家之上的更深層次的思考和總結(jié),否則,誰指導誰都是個問題。業(yè)務學習的方式很多,比如將以前的分析報告和取數(shù)案例都拿過來研究一下,不懂就問,總是一個漸進的過程,但需要時間和行業(yè)的沉淀。數(shù)據(jù)分析師最需要不斷提升的能力就是行業(yè)和業(yè)務知識,沒有之一。
數(shù)據(jù)總是在那里,它不會說話,你不僅要基于業(yè)務能力理解它,還要學會推演和分析,從中發(fā)現(xiàn)規(guī)律,迅速定位某個商業(yè)問題的關鍵屬性和決定因素,形成自己獨創(chuàng)性的見解,所謂心思縝密,滴水不漏,沒有思考邏輯沒有數(shù)據(jù)分析。而要形成獨特的見解,則來自于個人不斷的學習和思考,這里的學習更多的強調(diào)是跨領域和專業(yè),思考則更多的強調(diào)養(yǎng)成思考的習慣。
跨領域的的知識會給人帶來不同的思維方式和看問題的角度,每學習一個新的領域,相當于打開了一扇全新看世界的門,很多企業(yè)經(jīng)?;ㄖ亟鹫堊稍児編兔ψ鲆恍┓治鰣蟾妫ó斍白稍兎治霾辉傧褚郧俺韵悖皇瞧髽I(yè)不需要,而是他們也需要與時俱進),是有其原因的,企業(yè)往往看重咨詢公司廣闊的分析思路和全局的視野,比如經(jīng)常提的最佳實踐。在各個跨領域?qū)I(yè)中,經(jīng)濟學、心理學、統(tǒng)計學等對于數(shù)據(jù)分析的輔助又最強。
另一個思考能力是養(yǎng)成思考的習慣,所謂“學而不思則罔,思而不學則殆”。思考本身是一種實踐,它可以將你的知識更加系統(tǒng)化和深入化,數(shù)據(jù)分析一定程度上是用來驗證思路和啟發(fā)靈感的,“數(shù)據(jù)分析”從來不是“數(shù)據(jù)分析”本身,而是以“數(shù)據(jù)分析”為手段和表象,對業(yè)務的深刻理解、思考和判斷。
數(shù)據(jù)分析貫穿BIT、數(shù)據(jù)、技術、業(yè)務整個鏈條,數(shù)據(jù)分析師將BIT最終轉(zhuǎn)化成決策者理解的語言,跨越的流程很長,你需要面對不同的崗位,碰到不同的角色,采用不同的語言,表達你的要求和獲得你需要的東西,成為數(shù)據(jù)和業(yè)務的橋梁,沒有足夠的溝通能力很難。所謂上得了臺面,下得了廳堂。同時,大腦很多時候是非理性的,但如果你容易聽取他人的意見,特別是智者的意見,則可以幫你找到另一條出路,你犯錯的概率就會降低,相應的,你的分析就更有力量和說服力
從這個角度講,企業(yè)的管理者實際是最強的數(shù)據(jù)分析師,這個毋容置疑哦。數(shù)據(jù)分析師道的養(yǎng)成,絕非一日之功。
Part 2
數(shù)據(jù)分析師的養(yǎng)成課程
除了數(shù)據(jù)分析的道,再來講講數(shù)據(jù)分析的術,即工具和手段,如果你進入了一個企業(yè),希望盡快成長為一個數(shù)據(jù)分析師,還需要在以下4個方面加強學習,當然僅供參考,不用盡信,筆者相信每個人都需要形成自己的學習軌跡,不需要照搬它人:
業(yè)務學習有一個毛病,比如你看案例,往往接觸到的數(shù)據(jù)或使用的數(shù)據(jù)是局部的,因此,你的視野會受局限,在大多數(shù)公司里,很多數(shù)據(jù)分析師其實缺乏全局的數(shù)據(jù)視野,因為他不知道到底有多少數(shù)據(jù),因此,永遠只能在已知的數(shù)據(jù)里轉(zhuǎn)圈圈,當然,可能也夠了,但我這里要說得是做得最好。
數(shù)據(jù)分析師應該主動的向IT部門拿到最全的數(shù)據(jù)字典,對于數(shù)據(jù)字典進行持續(xù)的學習,了解每張表甚至字段的業(yè)務含義,理解的越透徹,你的分析潛力就越大。更有甚者,筆者還建議你去理解源系統(tǒng),從業(yè)務實現(xiàn)流程角度出發(fā)去理解對應數(shù)據(jù)的含義,因為有時候,簡單的業(yè)務描述在數(shù)據(jù)上的表達卻是非常復雜的,業(yè)務語言與數(shù)據(jù)語言很多時候是1對多關系,打個比方,你看到業(yè)務系統(tǒng)上某個菜單的功能,對應到系統(tǒng)中的數(shù)據(jù)是怎樣的,你能還原出來嗎?
當然,大多數(shù)數(shù)據(jù)分析師可能不需要進行系統(tǒng)數(shù)據(jù)學習,反正實踐中慢慢熟悉好了,但自頂向下的數(shù)據(jù)學習方式可以讓你有一個更好的基礎和更全局的數(shù)據(jù)視野。
有幾個層面的東西要學,依賴于實際的場景和你希望達到的階段:
首先,你要學會從數(shù)據(jù)庫或者其它源頭獲取數(shù)據(jù),很多數(shù)據(jù)分析師仍然依賴于IT人員獲取數(shù)據(jù),但大數(shù)據(jù)時代,真的有必要自己動手了,因為依賴他人效率太低了,起碼你要會SQL,SQL甚至基本上是為統(tǒng)計取數(shù)而生的方便工具,圖形化的透視方式也遠遠沒有SQL的表達能力強,這是基本功,其實, SQL就能解決大多數(shù)統(tǒng)計取數(shù)問題。
其次,你要會一些數(shù)據(jù)分析工具,EXCEL是最基本的,其實大多數(shù)數(shù)據(jù)分析基于EXCEL應付已經(jīng)綽綽有余了,EXCEL的圖形表達能力也已經(jīng)夠強。
最后,如果你希望更深一層,那就學習R語言、PYTHON、SPSS,SAS等,他們提供了更強大的挖掘能力,可以幫你把統(tǒng)計學的數(shù)據(jù)挖掘精髓發(fā)揮的淋漓盡致。
當然,如果有可能,你也要熟悉一下你所在企業(yè)的數(shù)據(jù)倉庫或大數(shù)據(jù)平臺,懂得一些基本的操作,對于你提升分析的自由度和靈活性也大有好處,比如自己搞個腳本定時跑數(shù)據(jù),打造個人的數(shù)據(jù)集市,現(xiàn)在數(shù)據(jù)分析的概念也越來越大,很多公司把對于大數(shù)據(jù)平臺的數(shù)據(jù)處理能力也納入到數(shù)據(jù)分析師的技能范疇。
以上層層遞推,其實數(shù)據(jù)分析師每在IT上前進一步,帶來的效益是幾何級的,比如你懂Hadoop,那么,你就可能離大數(shù)據(jù)更近一點。
終于講到大家都很關心的統(tǒng)計學知識了,推薦一些書吧:
《深入淺出數(shù)據(jù)分析》:講了數(shù)據(jù)分析到底是干什么的?數(shù)據(jù)分析都包含什么內(nèi)容?對新人們還是有一定的作用,難度容易。
《深入淺出統(tǒng)計學》:要了解常用數(shù)理統(tǒng)計模型(描述統(tǒng)計指標、聚類、決策樹、貝葉斯分類、回歸等),重點放在學習模型的工作原理、輸入內(nèi)容和輸出內(nèi)容,至于具體的數(shù)學推導,學不會可暫放一邊,難度容易。
《極簡統(tǒng)計學》:對統(tǒng)計推斷部分的闡述十分清晰,適合非統(tǒng)計背景的人工閱讀
《統(tǒng)計學:從數(shù)據(jù)到結(jié)論》:簡明精要,統(tǒng)計概念和R可以一起學習
《數(shù)據(jù)挖掘導論》:最近幾年數(shù)據(jù)挖掘教材中比較好的一本書,被美國諸多大學的數(shù)據(jù)挖掘課作為教材,筆者也最近買的,很好,很多概念解釋的比較清楚,難度中上。
《統(tǒng)計學習方法》:李航老師的扛鼎之作,難度難。
這些都是很實用的書籍,但結(jié)合了實踐學更好,對于特定的業(yè)務場景,就找對應的書看吧,網(wǎng)上推薦的也很多了,大家自己搜索。
表達能力作為數(shù)據(jù)分析人員,PPT制作能力是極其重要的一項能力,你總要通過某種形式表達出你的觀點,很核心的一點是需要有嚴密的邏輯,甚至滴水不漏,可以通過思維導圖來訓練自己,但實際的格式表達卻有點八股,一般都是現(xiàn)狀分析,原因剖析、分析結(jié)論和后續(xù)措施啥的,萬變不離其宗,當然你需要花一點時間來了解如何做重點突出,如何圖文并茂,PPT的寫作決非一日之功。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10