
2015年,“大數(shù)據(jù)” 成為國內年度熱詞,并首次出現(xiàn)在國家的《政府工作報告中》。同年,數(shù)據(jù)分析也開始如雨后春筍般成為朝陽行業(yè),數(shù)據(jù)分析和大數(shù)據(jù)相關職位一度霸屏各大招聘網(wǎng)站。
許多計算機、統(tǒng)計學和數(shù)學出身的畢業(yè)生紛紛開始投入數(shù)據(jù)分析行業(yè),同樣也有轉行的大隊伍,對于那些已經(jīng)工作許久的在職者或者偏文科類專業(yè)背景的人士可能會有這樣一些顧慮:
數(shù)據(jù)分析師崗位對年齡有限制嗎,我會不會錯過了最佳轉行的時機,我這個年紀再轉行還來得及嗎?
我大學學的是文科類專業(yè),對于數(shù)據(jù)分析我能跟得上或學得進去嗎?
我不是很喜歡編程或代碼,學習數(shù)據(jù)分析的知識會不會很吃力?
步入中年,也不是相關專業(yè)出身,面對家庭、事業(yè)、年齡的三重壓力,能不能成功轉行到數(shù)據(jù)分析師行業(yè)成為心頭的一塊大石……
沒有人能夠替你做出滿意的選擇,更沒有人可以預知未來的人生走向。但筆者可以分享一些信息為正在面臨人生抉擇的你提供啟發(fā)和思考或者說是為你加油打氣。
首先,讓我們看到進入數(shù)據(jù)分析需要哪些能力。
數(shù)據(jù)分析師入門標準
1、SQL
數(shù)據(jù)庫。做數(shù)據(jù)分析,數(shù)據(jù)是基本,數(shù)據(jù)的來源有很多,可能是第三方提供的數(shù)據(jù),也可能是自己爬蟲爬取的。但企業(yè)里更多的情況是,數(shù)據(jù)是存儲在數(shù)據(jù)庫里的,如何在數(shù)據(jù)庫里選取自己想要的、有約定條件的數(shù)據(jù),怎么建立多表之間的聯(lián)系就是SQL這部分需要掌握的技能,SQL也是數(shù)據(jù)分析最基礎的技能。
2、統(tǒng)計學
統(tǒng)計學可以分為描述性統(tǒng)計和推斷統(tǒng)計。推斷統(tǒng)計是統(tǒng)計學里的核心內容,統(tǒng)計學家一直在做的事情就是怎么根據(jù)樣本來評測總體;方差分析、回歸、聚類分析、主成份分析、時間序列分析等都是以后做數(shù)據(jù)分析可能有到的理論知識。這里推薦中國人民出版社賈俊平的《統(tǒng)計學》,是非常經(jīng)典的統(tǒng)計學習教材。
統(tǒng)計分析軟件很多,這里簡單介紹主流的3種。
1、SPSS
作為一款菜單式操作軟件要比編程性軟件入門簡單,主要優(yōu)點就是好上手。事實上,統(tǒng)計學專業(yè)常常在學習統(tǒng)計學原理之后學習SPSS的操作學習,對理論知識進行一個實踐。如今,SPSS在企業(yè)中常做數(shù)據(jù)量相對小的、數(shù)據(jù)質量較好的數(shù)據(jù)分析,如調查問卷后的數(shù)據(jù)進行分析。就業(yè)需求面的話現(xiàn)在來說相對沒有那么廣,不過對統(tǒng)計學理論的理解是有幫助的,推薦高等教育出版社張文彤的《SPSS統(tǒng)計分析基礎教程(第2版)》。
2、R語言
R 語言與起源于貝爾實驗室的S語言相似,R也是一款開源的為統(tǒng)計計算和數(shù)據(jù)可視化而生的軟件,R的功能非常豐富,所以R的學習曲線也較為陡峭。經(jīng)典的R學習書如人民郵電出版社的《R語言實戰(zhàn)(第2版)》。
3、Python
跟R一樣,Python也是一種動態(tài)編程語言,R跟Python的受歡迎程度時常變動,近年來,由于Python有不斷改良的庫(主要pandas),和大數(shù)據(jù)、人工智能等興起,企業(yè)越偏好用Python,Python由于其解釋性和功能的強大,因此市面上關于Python的書籍特別多,光是利用Python做數(shù)據(jù)分析這個方向就已經(jīng)很多了,大家看的多的話推薦Wes McKinney的《利用Python進行數(shù)據(jù)分析》。
學習過程中的擔憂
1、恐懼編程代碼
即便是計算機相關專業(yè)的學生,也未必做到全然投入喜歡到寫編程敲代碼的狀態(tài),何況是其他專業(yè)或者轉行的人呢?其實,數(shù)據(jù)分析師的學習和掌握重點不是寫編程敲代碼,而是對統(tǒng)計學和業(yè)務的理解,編程代碼僅僅是理解和熟悉為主。就好比一輛汽車,程序員就是負責制造汽車的人員,而數(shù)據(jù)分析師是駕駛汽車的人員,更多的是了解汽車器件、零件和功能使用。數(shù)據(jù)分析代碼以腳本語言為主,如Python,很多算法、函數(shù)已經(jīng)封裝好,不需要自己編寫,直接調用。所以這里的編程工作并不是大家腦海里那種程序員。數(shù)據(jù)分析師更注意的是對數(shù)據(jù)怎么進行預處理、使用什么模型、參數(shù)調優(yōu)等。
2、人工智能
未來是AI的時代,為什么不直接投入到大數(shù)據(jù)、機器學習等領域呢?暫且不說這個領域比數(shù)據(jù)分析所需要的知識,能力要求高多少倍,僅僅是入門所需要的學習內容就已經(jīng)嚇到很多人了。事實上,做數(shù)據(jù)分析會是未來轉入AI行業(yè)一個很好的跳板,數(shù)據(jù)分析算是如今學習成本和薪水報酬相對比較好的一種技術行業(yè)了。熟悉行業(yè)知識,又掌握數(shù)據(jù)分析、挖掘的能力,這些專業(yè)知識會成為你轉入未來人工智能時代的擁有跨界能力的巨大財富。
最后,希望這篇文章對正在考慮要不要轉行數(shù)據(jù)分析焦慮的你做一點信息上的幫助,幫助你弄清楚數(shù)據(jù)分析要做什么,要具備哪些技能,去理性的選擇,而不是因為這個行業(yè)陡峭的學習曲線而輕易放棄,也不是因為這個行業(yè)的火熱而輕易跟風。
附錄:
就職于美萊集團的CDA往期學員學習心得及方法
第一:預習 開課前一定要預習,特別是沒有基礎的同學,盡量長時間去看預習視頻,理解要點,做好筆記,記錄好你的問題。
第二:跟上節(jié)奏 老師講課的時候一定要跟上老師的節(jié)奏,因為信息量非常大,哪一塊沒聽懂及時問老師或同學,課程一環(huán)扣一環(huán),沒聽懂又不問,導致跟不上節(jié)奏,后續(xù)的課程就很容易節(jié)節(jié)跟不上了。這里也體現(xiàn)出預習的重要性,預習等于你學了兩遍,預習沒懂的,上課時重點聽,及時交流。
第三:練習 只聽理論不練會忘的很快,只有不斷地練習,不斷試錯才更容易掌握,找工作企業(yè)看的也是你掌握的技能,解決問題的能力,晚上加強練習也是對白天上課內容的一種回顧和總結,加強記憶。
第四:案例 三個月的課程以實戰(zhàn)案例收尾,前面是你所學的知識,最后的案例才是你輸出所學知識、解決問題的時候。
希望筆者的這些分享能夠給您的人生帶來一些正能量和勇氣,也祝愿您的抉擇可以讓您的人生煥發(fā)新的精彩和輝煌。上天從不辜負有心之人,好好加油吧!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10