
上周從買了兩本書《誰說菜鳥不會數(shù)據(jù)分析》和《大數(shù)據(jù)時代》,學習過程中想把書本內(nèi)容通過總結(jié)、理解、實踐、內(nèi)化掌握來變成自己的東西,把握好學習的節(jié)奏,堅持就好。
初級階段我更多的是來轉(zhuǎn)述前輩們總結(jié)出的東西,但自己若有實踐中的體會也會寫入其中(自己的體會粗體標出)。本來就是記錄菜鳥成長過程,所以內(nèi)容對行家來說太小兒科,對新手入門來說或許會有些幫助。
以下開始是對《誰說菜鳥不會分析數(shù)據(jù)》一書的學習總結(jié),第一章:數(shù)據(jù)分析那些事兒。
1.何謂數(shù)據(jù)分析?
用適當?shù)?a href='/map/tongjifenxi/' style='color:#000;font-size:inherit;'>統(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行詳細研究和概括總結(jié),以求最大化地發(fā)揮數(shù)據(jù)的作用,提取有用信息和形成結(jié)論,這一過程叫做數(shù)據(jù)分析。
2.數(shù)據(jù)分析的三大作用:現(xiàn)狀分析、原因分析、預測分析。
1.明確分析思路:
首先要明確分析目的:菜鳥與數(shù)據(jù)分析師的區(qū)別就在于菜鳥做分析時目的不明確,從而導致分析過程非常盲目。這點有比較深的體會,在公司里做過關于搜索和新手的產(chǎn)品數(shù)據(jù)分析,自己對分析目的沒考慮太多,靠的是前人留下的上期數(shù)據(jù)分析結(jié)果,倘若讓我從零開始做,估計會很盲目。
然后確定分析思路:梳理分析思路,并搭建分析框架,把分析目的分解成若干個不同的分析要點,即如何具體開展數(shù)據(jù)分析,需要從哪幾個角度進行分析,采用哪些分析指標。
最后還要確保分析框架的體系化,使分析結(jié)果具有說服力:營銷方面的理論模型有4P、用戶使用行為、STP理論、SWOT等;管理方面的理論模型有PEST、5W2H、時間管理、生命周期、邏輯樹、金字塔、SMART等。在上周一個匯報上使用了SWOT分析方法,對這些營銷或管理的模型還都很陌生。
2.數(shù)據(jù)收集:
一般數(shù)據(jù)來源于以下幾種方式:數(shù)據(jù)庫、公開出版物(統(tǒng)計年鑒或報告)、互聯(lián)網(wǎng)、市場調(diào)查。
3.數(shù)據(jù)處理:
數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)提取、數(shù)據(jù)計算等處理方法。導師提過在做數(shù)據(jù)處理時,不要在原始數(shù)據(jù)上進行數(shù)據(jù)處理以防原始數(shù)據(jù)丟失,保留數(shù)據(jù)處理過程以便發(fā)現(xiàn)錯誤時查找。
4.數(shù)據(jù)分析:
數(shù)據(jù)分析是指用適當?shù)姆治龇椒肮ぞ?,對處理過的數(shù)據(jù)進行分析,提取有價值的信息,形成有效結(jié)論的過程。
與數(shù)據(jù)挖掘的關系是數(shù)據(jù)挖掘側(cè)重解決四類數(shù)據(jù)分析問題:分類、聚類、關聯(lián)和預測,重點在尋找模式與規(guī)律。
5.數(shù)據(jù)展現(xiàn):
一般情況下,數(shù)據(jù)是通過表格和圖形的方式來呈現(xiàn)的。常用的數(shù)據(jù)圖表包括餅圖、柱形圖、條形圖、折線圖、散點圖、雷達圖等。進一步加工整理變成我們需要的圖形,如金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。
在一般情況下,能用圖說明問題的就不用表格,能用表說明問題的就不用文字。
6.報告撰寫:
一份好的數(shù)據(jù)分析報告,首先需要有一個好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。結(jié)構清晰、主次分明可以使閱讀者正確理解報告內(nèi)容;圖文并茂,可以令數(shù)據(jù)更加生動活潑,提高視覺沖擊力,有助于閱讀者更形象、直觀地看清楚問題和結(jié)論,從而產(chǎn)生思考。
另外,數(shù)據(jù)分析報告需要有明確的結(jié)論,沒有明確結(jié)論的分析稱不上分析,好的分析報告一定要有建議或解決方案。
1.分析目的不明確,為分析而分析。
2.缺乏業(yè)務知識,分析結(jié)果偏離實際:數(shù)據(jù)分析師的任務不是單純做數(shù)學題,數(shù)據(jù)分析師還必須懂營銷,懂管理,更要懂策略。上周五聽了公司專門做數(shù)據(jù)分析的同事做的關于新手留存的數(shù)據(jù)分析專題,他們數(shù)理統(tǒng)計專業(yè)知識必然過硬,而且對業(yè)務比較熟悉,能通過數(shù)據(jù)結(jié)合不同業(yè)務做出相應結(jié)論,還能為不同業(yè)務提出改進意見,不熟悉業(yè)務不懂策略怎行?
3.一味追求使用高級分析方法,熱衷研究模型。
1.數(shù)據(jù)分析的廣闊前景:根據(jù)美國勞工部預測,到2018年,數(shù)據(jù)分析師的需求量將增長20%。就算你不是數(shù)據(jù)分析師,但數(shù)據(jù)分析技能也是未來必不可少的工作技能之一。
2.數(shù)據(jù)分析師的職業(yè)要求:懂業(yè)務,懂管理,懂分析,懂工具,還要懂設計。
其中,懂分析中,基本的分析方法有:對比分析法、分組分析法、交叉分析法、結(jié)構分析法、漏斗圖分析法、綜合評價分析法、因素分析法、矩陣關聯(lián)分析法等;高級的分析方法有:相關分析法、回歸分析法、聚類分析法、判別分析法、主成分分析法、因子分析法、對應分析法、時間序列等。
懂工具中,常用的數(shù)據(jù)分析工具有Excel、Access、SPSS、SAS,先學會用Excel,它能解決80%甚至100%的問題。
懂設計中,圖表的設計是大學問,如圖形的選擇、版式的設計、顏色的搭配等,都需要掌握一定的設計原則。
以下幾個常見的只是提一下:平均數(shù)、絕對數(shù)和相對數(shù)、百分比和百分點、頻數(shù)和頻率、比例和比率。
另外倍數(shù)與番數(shù)、同比與環(huán)比,我之前有疑問的特別提下。番數(shù)是指原來數(shù)量的2的N次方倍,比如翻一番為原來數(shù)量的2倍(2的一次方),翻兩番為4倍(2的二次方)。同比是與歷史同時期進行比較得到的數(shù)值,環(huán)比是指與前一個統(tǒng)計期進行比較得到的數(shù)值。(文章來源:CDA數(shù)據(jù)分析師培訓官網(wǎng))
這部分主要是對數(shù)據(jù)分析有了一個全面的了解而又粗略的認識,說實話這樣的總結(jié)復述后很多地方我印象也不深,但總比看過一遍后不再管能多記住一些,當然能實踐才會印象更深。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構數(shù)據(jù)價值的核心操盤手 表格結(jié)構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10