一、數(shù)據(jù)分析小白入門系列
1、《深入淺出數(shù)據(jù)分析》
推薦指數(shù):★★★★★
深入淺出系列應該是大多數(shù)數(shù)據(jù)分析師的啟蒙讀物,內(nèi)容非常適合小白入門,雖然是入門級別的讀物,比較簡單,但基本的數(shù)據(jù)分析內(nèi)容涉及全面,講解的比較清晰,最后談到了R語言。
優(yōu)點:圖文并茂,講解絲毫不枯燥,閱讀速度會很快;
缺點:內(nèi)容太淺了,淺到了根本沒有必要讀第二遍的地步;
2、《誰說菜鳥不會數(shù)據(jù)分析》
推薦指數(shù):★★★★☆
這本書不僅講解了一些常見的通用數(shù)據(jù)分析技巧,還附帶了Excel的一些知識以及數(shù)據(jù)分析在公司中所處的位置,對職場了解亦有一定幫助,整體來說有一定可讀性,想入門Excel的同學必看!
優(yōu)點:操作工具書,相當于一本Excel表哥表姐的入門指導書;
缺點:更偏excel,沒有介紹數(shù)據(jù)分析的大體框架,因此書名一直被詬??;
3、《人人都會數(shù)據(jù)分析》
推薦指數(shù):★★★★☆
從業(yè)務(wù)分析到數(shù)據(jù)分析職場,從EXCEL數(shù)據(jù)處理到可視化操作,這本書基本將整個數(shù)據(jù)分析的內(nèi)容都講了一遍,比較適合想要入行業(yè)務(wù)分析和轉(zhuǎn)行的同學們閱讀。
優(yōu)點:內(nèi)容全面而且十分系統(tǒng),你想了解的數(shù)據(jù)分析知識都能從這本書里找到;
缺點:缺少實踐操作和案例解讀,理論性質(zhì)十分強,易讀性略低;
二、統(tǒng)計學入門系列
1、《赤裸裸的統(tǒng)計學》
推薦指數(shù):★★★★★
很有意思的一本統(tǒng)計學入門讀物,作者查爾斯韋蘭本來是一名記者,所以寫作技巧非常高,筆法幽默俏皮,著重闡明了統(tǒng)計學的關(guān)鍵概念,如概率、相關(guān)與回歸分析,讓人們一睹被誤讀數(shù)據(jù)背后的統(tǒng)計學奧秘。
優(yōu)點:幾乎每個知識點都有大量的例子進行說明,寓教于樂;
缺點:因為是國外著書,所以文中大量的例子可能對我們沒有很大的參考意義;
2、《統(tǒng)計學習方法》
推薦指數(shù):★★★☆☆
其實不應該把這本書歸入入門系列,因為這本書中有相當多的公式證明、概念解釋等等,其中雖然有一些晦澀難懂的地方,但是作為數(shù)據(jù)分析統(tǒng)計學的教科書是一點都不過分的,建議大家閱讀三遍以上。
優(yōu)點:本書精簡不啰嗦,面面俱到,從原理上給你整得明明白白的,輔以適當?shù)睦?,沒有多余的圖表;
缺點:非工科生和統(tǒng)計學零基礎(chǔ)的同學,需要不斷查閱資料;
三、數(shù)據(jù)處理入門系列
1、《MYSQL必知必會》
推薦指數(shù):★★★★★
sql入門必看的一本書,非常適合新手學習sql的一本工具書,翻譯水平也很高,最深的內(nèi)容涉及到了一些復雜查詢和儲存,適合學習者隨時查漏補缺!
優(yōu)點:簡單精煉,閱讀速度會很快,而且方便隨時查閱
缺點:內(nèi)容看起來簡單,但是需要自己動手實操,要不然看完之后就索然無味
2、《干凈的數(shù)據(jù):數(shù)據(jù)清洗入門與實踐》
推薦指數(shù):★★★☆☆
由數(shù)據(jù)清洗開始窺竊數(shù)據(jù)分析,介紹了很多有意思的東西,輕松讀物,適合沒有編程基礎(chǔ)的同學閱讀學習!
優(yōu)點:算是還可以的爬蟲入門書籍,有技術(shù)講解,最后也有案例說明;
缺點:內(nèi)容過于雜亂,而且對于已經(jīng)有編程基礎(chǔ)的人來說非常簡單,沒有看的必要;
四、大數(shù)據(jù)分析進階系列
1、《Hadhoop數(shù)據(jù)分析》
推薦指數(shù):★★★★☆
大數(shù)據(jù)分析科學的必看讀物,主要內(nèi)容是集群計算和分析概述,為數(shù)據(jù)科學家深入了解特定主題領(lǐng)域鋪平道路,從數(shù)據(jù)科學家的視角介紹Hadoop集群計算和分析。
優(yōu)點:十分強悍的理論著作,比較亮點的地方是第一部分的分布式講解;
缺點:翻譯十分不友好!
2、《Spark大數(shù)據(jù)分析》
推薦指數(shù):★★★★☆
一書針對使用Apache Spark框架執(zhí)行批處理、互操作、圖表、數(shù)據(jù)流分析,以及機器學習等不同類型的大數(shù)據(jù)分析項目提供了實用的指南。其中介紹了Spark core及其加載項庫,包括Spark SQL、Spark Streaming、GraphX、Mllib,以及Spark ML。
優(yōu)點:入門spark的教科書,沒有什么閱讀難看,通俗易懂;
缺點:具體的實際操作代碼還是比較少,同時也沒有提供比較好的分析數(shù)據(jù);
3、《鮮活的數(shù)據(jù):數(shù)據(jù)可視化指南》
推薦指數(shù):★★★☆☆
《鮮活的數(shù)據(jù):數(shù)據(jù)可視化指南》這本書是我最開始了解數(shù)據(jù)可視化看的第一本書,讓我對數(shù)據(jù)可視化從一個看一團迷霧的小白白可以大概的了解到了一個輪廓。
優(yōu)點:作者的可視化功底非常強,內(nèi)容豐富,設(shè)計可視化的方方面面;
缺點:需要R語言基礎(chǔ);
五、高級數(shù)據(jù)分析系列
1、《機器學習》
推薦指數(shù):★★★★☆
這本書用簡單的語言把復雜難懂的機器學習算法解釋清楚了,它將機器學習的基礎(chǔ)理論與日常數(shù)據(jù)分析的實際工具相結(jié)合。
優(yōu)點:對機器學習有一個很全面的解讀和介紹,適合新手;
缺點:這本書已經(jīng)比較老了,內(nèi)容中有一些過時的地方;
2、《數(shù)據(jù)分析實戰(zhàn)》
推薦指數(shù):★★★☆☆
本書首先介紹了商業(yè)領(lǐng)域里通用的數(shù)據(jù)分析框架,然后根據(jù)該框架,結(jié)合8個真實的案例,詳細解說了通過數(shù)據(jù)分析解決各種商業(yè)問題的流程,避免紙上談兵。
優(yōu)點:商業(yè)數(shù)據(jù)分析領(lǐng)域必看的一本書,對其他行業(yè)借鑒意義不大;
缺點:R語言和代碼部分的占比比較大,需要R基礎(chǔ);
六、數(shù)據(jù)化運營系列
1、《數(shù)據(jù)化管理》
推薦指數(shù):★★★★★
本書從企業(yè)的一個個具體的需求出發(fā),使讀者對數(shù)據(jù)分析的了解循序漸進,將復雜的數(shù)據(jù)分析知識體系串成有機的整體。
優(yōu)點:大量的企業(yè)經(jīng)營案例,系統(tǒng)闡述數(shù)據(jù)分析的專業(yè)思路、方法和技能;
缺點:局限零售電商行業(yè),其他行業(yè)借鑒意義不大;
2、《如何用數(shù)據(jù)解決實際問題》
推薦指數(shù):★★★★☆
這本書整體非常通俗易懂,通過縝密的假設(shè)原因,推斷可能問題,檢驗結(jié)論,到最后給出實際可操作的建議,這才是一個數(shù)據(jù)分析該有的流程。
優(yōu)點:書中例子非常多,也非常有借鑒意義;
缺點:內(nèi)容不算多,會有意猶未盡的感覺;
七、數(shù)據(jù)科學系列
1、《數(shù)據(jù)科學入門》
推薦指數(shù):★★★★☆
雖然書名帶著入門,但是這本書不太適合作為數(shù)據(jù)科學的入門書,可以作為泛讀的東西翻一翻看看,對數(shù)據(jù)科學進行了一次系統(tǒng)的介紹。
優(yōu)點:這本書能帶著你把一些基礎(chǔ)算法,從底層開始重構(gòu)一遍,很基礎(chǔ);
缺點:每個概念不作推導,不作說明,直接拋出來后就跟上一堆代碼,很不友好!
2、《數(shù)據(jù)科學實戰(zhàn)》
推薦指數(shù):★★★★☆
對具體算法細節(jié)未做深入探討,但屬于名副其實的實戰(zhàn),值得一讀,尤其推薦六九兩章的部分內(nèi)容。
優(yōu)點:翻譯很過關(guān),可以作為數(shù)據(jù)科學的啟蒙之書!
缺點:不能用來入門算法,算法部分比較粗略;
-----------------------【數(shù)據(jù)分析書單下載】----------------------------
鏈接:https://pan.baidu.com/s/1oSiRaOrImgPmqYlMVyglDA
提取碼:wie2








暫無數(shù)據(jù)