
從入門到精通:互聯(lián)網(wǎng)數(shù)據(jù)分析書籍清單
任何一個技能的學(xué)習(xí),都有從淺到深的過程,數(shù)據(jù)分析也不例外。一個完整的數(shù)據(jù)分析知識體系類似金字塔結(jié)構(gòu):最頂層是對數(shù)據(jù)價值的認(rèn)知、業(yè)務(wù)理解,中間是數(shù)據(jù)分析方法論,而最底層則是數(shù)據(jù)分析的解決方案或者具體的操作方法。我把數(shù)據(jù)分析的推薦書籍劃分成三個段位,便于大家漸進(jìn)式學(xué)習(xí)。
入門版適合數(shù)據(jù)分析的入門者、對數(shù)據(jù)分析沒有整體概念的人,常見于應(yīng)屆畢業(yè)生、經(jīng)驗(yàn)尚淺的轉(zhuǎn)行者。
入門版推薦書籍
《深入淺出數(shù)據(jù)分析》:O’Relly出版的HeadFirst (深入淺出)系列書籍之一,書中有大量的圖片和有趣的案例組合。本書淺顯易懂形象生動,可以使入門者對分析的概念有個全面的認(rèn)知。
《誰說菜鳥不會數(shù)據(jù)分析》:本書詳細(xì)介紹了數(shù)據(jù)分析的基本方法和過程,并且以Excel表格為例進(jìn)行了案例闡述。同時本書還介紹了數(shù)據(jù)分析在職場的意義,可以幫助職場小白快速上手。
《赤裸裸的統(tǒng)計學(xué)》:作者年輕時是個追求學(xué)習(xí)的學(xué)霸,后來自己從統(tǒng)計學(xué)中發(fā)掘了很多可以應(yīng)用到生活的地方。這也是本書的主旨,結(jié)合生活講解統(tǒng)計知識,生動有趣。可以避免統(tǒng)計學(xué)一上來就大講貝葉斯概率和隨機(jī)分析的枯燥。
同樣類似的書籍還有《統(tǒng)計數(shù)字會撒謊》,這本書知名度要高點(diǎn),通過揭露“虛假數(shù)字信息”來幫助大家理解背后的統(tǒng)計學(xué)原理。
進(jìn)階版具有一定的行業(yè)針對性,要求分析者具備一定的數(shù)據(jù)分析常識和業(yè)務(wù)理解;適合網(wǎng)站分析師,商業(yè)分析師以及數(shù)據(jù)產(chǎn)品經(jīng)理等人群。
進(jìn)階版推薦書籍
《精通 web analytics 2.0》:Analytics將點(diǎn)擊流網(wǎng)站分析工具與定性數(shù)據(jù)、測試與試驗(yàn)以及競爭情報工具相結(jié)合,從而推演出詳盡的網(wǎng)站戰(zhàn)略以及操作層方案。此書雖老,但其中很多思想和流量分析的案例仍然很有借鑒意義,現(xiàn)在國內(nèi)只能買到二手的舊書。
與此類似的有《網(wǎng)站分析實(shí)戰(zhàn)》,是國內(nèi)一本講網(wǎng)站分析的書,沒有上面經(jīng)典,但勝在新出,很多案例和理念都有及時的更新。
《深入淺出統(tǒng)計學(xué)》:與上面的《深入淺出數(shù)據(jù)分析》同屬于Headfirst系列書籍,運(yùn)用充滿互動性的真實(shí)世界情節(jié),幫助讀者快速了解統(tǒng)計方面的理論知識。
《數(shù)據(jù)化管理》:黃成明著,講解在企業(yè)中應(yīng)用數(shù)據(jù)的例子,讀完受益匪淺,里面舉的很多例子都很接地氣。雖說偏向于零售業(yè)管理,但大道歸一,可適用于很多行業(yè),當(dāng)時依據(jù)里面的理念規(guī)劃了美團(tuán)外賣面向 BD 的數(shù)據(jù)產(chǎn)品。
《MySQL必知必會》:這本也是我當(dāng)年學(xué)習(xí) SQL 的入門書,薄冊子一本,看起來很快。SQL 是個性價比很高的技能,簡單而強(qiáng)大。任何想進(jìn)一步提高自己數(shù)據(jù)分析技能的產(chǎn)品/運(yùn)營/分析師 同學(xué),都建議點(diǎn)亮這個技能點(diǎn)。
《互聯(lián)網(wǎng)增長的第一本數(shù)據(jù)分析手冊》:全書以增長為主題。這本手冊介紹了互聯(lián)網(wǎng)創(chuàng)業(yè)企業(yè)增長方法論、互聯(lián)網(wǎng)數(shù)據(jù)分析的常見方法(趨勢、轉(zhuǎn)化、留存、實(shí)時、分群、細(xì)查、熱圖)、細(xì)分行業(yè)(如SaaS、互聯(lián)網(wǎng)金融、電商等)的應(yīng)用。
更高階的數(shù)據(jù)分析相對來說專業(yè)性就強(qiáng)了,如涉及到企業(yè)內(nèi)部數(shù)據(jù)治理,數(shù)據(jù)結(jié)合的業(yè)務(wù)分析,數(shù)據(jù)可視化等。當(dāng)然,還有數(shù)據(jù)挖掘算法之類的更深入的東西,這塊沒有研究就不瞎推薦了。
高階版推薦書籍
《決戰(zhàn)大數(shù)據(jù)》:阿里巴巴前數(shù)據(jù)副總裁車品覺老師所著,講解了阿里巴巴在企業(yè)內(nèi)部治理數(shù)據(jù)過程中的心得,所講“存-通-用”數(shù)據(jù)管理三板斧和“從數(shù)據(jù)化運(yùn)營到運(yùn)營數(shù)據(jù)”,字字珠璣,可堪借鑒。
《精益數(shù)據(jù)分析》:此書優(yōu)勢在于將企業(yè)分成了幾個大的行業(yè)類別,并分門別類的講解了每個行業(yè)的商業(yè)模式特點(diǎn)及分析技巧,對使用者的分析能力要求較高,且必須具備相應(yīng)的業(yè)務(wù)知識。
《The Wall Street Journal Guide to Information Graphics》,華爾街日報負(fù)責(zé)商業(yè)分析的人做的可視化指南,精華且實(shí)用,我之前寫過讀書筆記《華爾街日報是這樣做數(shù)據(jù)可視化的》,可供大家參考。
《數(shù)據(jù)倉庫經(jīng)典教程》:網(wǎng)上有人整理出來的資料,優(yōu)點(diǎn)是簡單明了,不像正常的數(shù)據(jù)倉庫教材厚厚一本。
當(dāng)然,數(shù)據(jù)分析是一門很深的學(xué)問,我也只是窺得冰山一角。要想做好數(shù)據(jù)分析必須具備多方面的技能:需要看清數(shù)據(jù)的價值并且懂業(yè)務(wù),需要熟知數(shù)據(jù)分析的方法論,同時也要熟練掌握數(shù)據(jù)分析軟件的操作。在學(xué)習(xí)上面數(shù)據(jù)分析推薦書籍的同時,不斷在實(shí)踐中加深自己的理解,用數(shù)據(jù)來驅(qū)動業(yè)務(wù)和客戶增長。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11