
CDA數(shù)據(jù)崗位模型:
基于CDA多年的數(shù)據(jù)分析教學(xué)經(jīng)驗(yàn)以及對(duì)當(dāng)下企業(yè)數(shù)據(jù)相關(guān)崗位、薪資待遇的調(diào)查研究,總結(jié)出來(lái)了一套職場(chǎng)“崗位模型”。最左側(cè)是經(jīng)典的CDA LEVEL 1 2 3等級(jí)標(biāo)準(zhǔn),每個(gè)等級(jí)對(duì)應(yīng)企業(yè)相關(guān)數(shù)據(jù)崗位及薪資范圍。圖片中部為對(duì)應(yīng)崗位的技能列表,即勝任某一崗位需要擁有什么樣的能力。最后側(cè)是該技能對(duì)應(yīng)的CDA精英學(xué)院課程。CDA等級(jí)標(biāo)準(zhǔn)還規(guī)定了各個(gè)級(jí)別的能力概要,如下表所示:
【CDA等級(jí)認(rèn)證考試大綱】
級(jí)別 |
Level I (業(yè)務(wù)分析師) |
Level II (建模分析師) |
Level II (大數(shù)據(jù)分析師) |
Level III (數(shù)據(jù)科學(xué)家) |
---|---|---|---|---|
理論 基礎(chǔ) |
概率論、統(tǒng)計(jì)學(xué)理論基礎(chǔ) | 統(tǒng)計(jì)學(xué)、概率論和數(shù)理統(tǒng)計(jì)、多元統(tǒng)計(jì)分析、時(shí)間序列、數(shù)據(jù)挖掘 |
概率論和數(shù)理統(tǒng)計(jì)、Python基礎(chǔ)、Linux基礎(chǔ)、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí) |
統(tǒng)計(jì)學(xué)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、數(shù)據(jù)治理和項(xiàng)目管理 |
軟件 要求 |
必要:Excel、SQL 可選:Python、SPSS、R等 |
必要:Excel、SQL 可選:Python、R、SPSS Modeler、Spark等 |
必要: SQL、Hadoop、HDFS、Mapreduce、Hbase、Hive、Sqoop、Spark 可選:Kafka、Flume、ZooKeeper等 |
必要:Excel、SQL、Python、Hadoop、Spark 可選:R、SAS、Tensorflow等 |
分析方 法要求 |
掌握基本數(shù)據(jù)預(yù)處理方法,SQL數(shù)據(jù)庫(kù)技術(shù),數(shù)據(jù)分析方法(描述性統(tǒng)計(jì)分析,推斷性統(tǒng)計(jì)分析,方差分析,線(xiàn)性回歸等);市場(chǎng)調(diào)研(數(shù)據(jù)報(bào)告),常用數(shù)據(jù)分析模型(聚類(lèi)分析、邏輯回歸、時(shí)間序列等)。 | 除掌握基本數(shù)據(jù)處理及分析方法以外,還應(yīng)掌握高級(jí)數(shù)據(jù)分析及數(shù)據(jù)挖掘方法(特征工程、貝葉斯、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、集成方法、關(guān)聯(lián)規(guī)則、序列模式等)和可視化技術(shù)。 |
熟練掌握hadoop集群搭建;熟悉nosql數(shù)據(jù)庫(kù)的原理及特征,并會(huì)運(yùn)用在相關(guān)的場(chǎng)景;熟練運(yùn)用Spark及Spark MLLib算法庫(kù)提供的進(jìn)行大數(shù)據(jù)分析的數(shù)據(jù)挖掘算法,包括無(wú)監(jiān)督算法(k-means算法、DBSCAN算法、FP-Growth)、有監(jiān)督學(xué)習(xí)算法(決策樹(shù)、SVM、貝葉斯、集成算法、神經(jīng)網(wǎng)絡(luò)、協(xié)同過(guò)濾)等算法的原理和使用范圍 |
除掌握數(shù)據(jù)分析和挖掘的方法之外,還需了解數(shù)據(jù)治理技術(shù),計(jì)算機(jī)編程技術(shù),機(jī)器學(xué)習(xí),人工智能,大數(shù)據(jù)分析架構(gòu)以及業(yè)務(wù)分析方法,包括代碼管理、敏捷分析、戰(zhàn)略分析,產(chǎn)品管理,風(fēng)險(xiǎn)管理、客戶(hù)關(guān)系管理,項(xiàng)目管理,運(yùn)營(yíng)管理等結(jié)合具體行業(yè)的業(yè)務(wù)分析方法。 |
業(yè)務(wù)分 析能力 |
熟知業(yè)務(wù),能夠根據(jù)問(wèn)題業(yè)務(wù)指標(biāo)提取公司數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù),進(jìn)行整理、清洗、處理,通過(guò)相應(yīng)數(shù)據(jù)分析方法,結(jié)合軟件平臺(tái)應(yīng)用完成對(duì)數(shù)據(jù)的分析和報(bào)告。 |
可以將業(yè)務(wù)目標(biāo)轉(zhuǎn)化為數(shù)據(jù)分析目標(biāo);熟悉常用算法和數(shù)據(jù)結(jié)構(gòu),熟悉企業(yè)數(shù)據(jù)庫(kù)構(gòu)架建設(shè);針對(duì)不同分析主體,可以熟練的進(jìn)行維度分析,能夠從海量數(shù)據(jù)中搜集并提取信息;通過(guò)相關(guān)數(shù)據(jù)分析方法,結(jié)合一個(gè)或多個(gè)數(shù)據(jù)分析軟件完成對(duì)海量數(shù)據(jù)的處理和分析。 |
熟悉hadoop+hive+spark進(jìn)行大數(shù)據(jù)分析的架構(gòu)設(shè)計(jì),并能針對(duì)不同的業(yè)務(wù)提出大數(shù)據(jù)架構(gòu)的解決思路。掌握hadoop+hive+ Spark+tableau平臺(tái)上Spark MLlib、SparkSQL的功能與應(yīng)用場(chǎng)景,根據(jù)不同的數(shù)據(jù)業(yè)務(wù)需求選擇合適的組件進(jìn)行分析與處理。并對(duì)基于Spark框架提出的模型進(jìn)行對(duì)比分析與完善。 |
帶領(lǐng)數(shù)據(jù)團(tuán)隊(duì),能夠?qū)⑵髽I(yè)的數(shù)據(jù)資產(chǎn)進(jìn)行有效的整合和管理,建立內(nèi)外部數(shù)據(jù)的連接;熟悉數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)造理論,可以指導(dǎo)ETL工程師業(yè)務(wù)工作;可以面向數(shù)據(jù)挖掘運(yùn)用主題構(gòu)造數(shù)據(jù)集市;在人和數(shù)據(jù)之間建立有機(jī)聯(lián)系,面向用戶(hù)數(shù)據(jù)創(chuàng)造不同特性的產(chǎn)品和系統(tǒng);具有數(shù)據(jù)規(guī)劃的能力。 |
結(jié)果展 現(xiàn)能力 |
能夠形成邏輯清晰的報(bào)告,傳遞分析結(jié)果,對(duì)實(shí)際業(yè)務(wù)提出建議和策略。 | 報(bào)告體現(xiàn)數(shù)據(jù)挖掘的整體流程,層層闡述信息的收集、模型的構(gòu)建、結(jié)果的驗(yàn)證和解讀,對(duì)行業(yè)進(jìn)行評(píng)估,優(yōu)化和決策。 |
報(bào)告能體現(xiàn)大數(shù)據(jù)分析的優(yōu)勢(shì),能清楚地闡述數(shù)據(jù)采集、大數(shù)據(jù)處理過(guò)程及最終結(jié)果的解讀,同時(shí)提出模型的優(yōu)化和改進(jìn)之處,以利于提升大數(shù)據(jù)分析的商業(yè)價(jià)值。 |
報(bào)告形式多樣化,圖文并茂,邏輯嚴(yán)密。為企業(yè)數(shù)據(jù)資產(chǎn)管理提供詳細(xì)方案,對(duì)企業(yè)發(fā)展提供數(shù)據(jù)規(guī)劃策略。 |
CDA Level I :業(yè)務(wù)數(shù)據(jù)分析師。專(zhuān)指政府、金融、電信、零售等行業(yè)前端業(yè)務(wù)人員;從事市場(chǎng)、管理、財(cái)務(wù)、供應(yīng)、咨詢(xún)等職位業(yè)務(wù)人員;非統(tǒng)計(jì)、計(jì)算機(jī)專(zhuān)業(yè)背景零基礎(chǔ)入行和轉(zhuǎn)行就業(yè)人員。CDA Level Ⅰ業(yè)務(wù)數(shù)據(jù)分析師需要掌握概率論和統(tǒng)計(jì)理論基礎(chǔ),能夠熟練運(yùn)用Excel、R、Python、SPSS等一門(mén)專(zhuān)業(yè)分析軟件,有良好的商業(yè)理解能力,能夠根據(jù)業(yè)務(wù)問(wèn)題指標(biāo)利用常用數(shù)據(jù)分析方法進(jìn)行數(shù)據(jù)的處理與分析,并得出邏輯清晰的業(yè)務(wù)報(bào)告。
CDA Level II:建模分析師。一年以上數(shù)據(jù)分析崗位工作經(jīng)驗(yàn),或通過(guò)CDA Level Ⅰ認(rèn)證。專(zhuān)指政府、金融、電信、零售、互聯(lián)網(wǎng)、電商、醫(yī)學(xué)等行業(yè)專(zhuān)門(mén)從事數(shù)據(jù)分析與數(shù)據(jù)挖掘的人員。在Level Ⅰ的基礎(chǔ)上更要求掌握多元統(tǒng)計(jì)、時(shí)間序列、數(shù)據(jù)挖掘等理論知識(shí),掌握高級(jí)數(shù)據(jù)分析方法與數(shù)據(jù)挖掘算法,能夠熟練運(yùn)用SPSS Modeler、PYTHON、R、SAS等至少一門(mén)專(zhuān)業(yè)分析軟件,熟悉適用SQL訪(fǎng)問(wèn)企業(yè)數(shù)據(jù)庫(kù),結(jié)合業(yè)務(wù),能從海量數(shù)據(jù)提取相關(guān)信息,從不同維度進(jìn)行建模分析,形成邏輯嚴(yán)密能夠體現(xiàn)整體數(shù)據(jù)挖掘流程化的數(shù)據(jù)分析報(bào)告。
CDA Level II:大數(shù)據(jù)分析師。一年以上數(shù)據(jù)分析崗位工作經(jīng)驗(yàn),或通過(guò)CDA Level Ⅰ認(rèn)證。專(zhuān)指政府、金融、電信、零售、互聯(lián)網(wǎng)、電商、醫(yī)學(xué)等行業(yè)專(zhuān)門(mén)從事數(shù)據(jù)分析與云端大數(shù)據(jù)的人員。在Level Ⅰ的基礎(chǔ)上要求掌握J(rèn)AVA語(yǔ)言和linux操作系統(tǒng)知識(shí),能夠掌握運(yùn)用Hadoop、Hive、Spark等專(zhuān)業(yè)大數(shù)據(jù)架構(gòu)及分析軟件,從海量數(shù)據(jù)中提取相關(guān)信息,并能夠結(jié)合python等軟件,形成嚴(yán)密的數(shù)據(jù)分析報(bào)告。
CDA Level III:數(shù)據(jù)科學(xué)家。三年以上數(shù)據(jù)分析崗位工作經(jīng)驗(yàn),或通過(guò)任意一門(mén)CDA Level ⅠI認(rèn)證。專(zhuān)指政府、金融、電信、零售、互聯(lián)網(wǎng)、電商、醫(yī)學(xué)等行業(yè)數(shù)據(jù)分析資深人員。掌握前沿AI相關(guān)技術(shù),負(fù)責(zé)制定企業(yè)數(shù)據(jù)發(fā)展戰(zhàn)略,發(fā)現(xiàn)企業(yè)數(shù)據(jù)價(jià)值,提升企業(yè)運(yùn)行效率,增加企業(yè)價(jià)值。能夠帶領(lǐng)數(shù)據(jù)團(tuán)隊(duì)將企業(yè)的數(shù)據(jù)資產(chǎn)進(jìn)行有效的整合和管理,建立內(nèi)外部數(shù)據(jù)的連接;具有數(shù)據(jù)規(guī)劃的能力。
根據(jù)各等級(jí)的要求,適合大家學(xué)習(xí)的方法需要科學(xué)、專(zhuān)業(yè)地規(guī)劃,從“CDA數(shù)據(jù)分析研究院”長(zhǎng)年的項(xiàng)目合作和培訓(xùn)經(jīng)驗(yàn)來(lái)看,對(duì)于一個(gè)零基礎(chǔ)的學(xué)員需要做到以下的步驟來(lái)進(jìn)行系統(tǒng)性的規(guī)劃:
一、自身檢查:是否適合數(shù)據(jù)分析崗位。
什么樣的人適合做數(shù)據(jù)分析師?
1. 對(duì)數(shù)據(jù)敏感:對(duì)數(shù)字不恐懼,經(jīng)常關(guān)注行業(yè)數(shù)據(jù)動(dòng)態(tài),能夠從數(shù)據(jù)變化中自行感覺(jué)出實(shí)務(wù)背后的原因規(guī)律。
2. 抗壓力與耐性:在處理數(shù)據(jù)中需要強(qiáng)大抗壓力和耐心。與數(shù)據(jù)打交道需要你愛(ài)上數(shù)據(jù)而不是排斥數(shù)據(jù)。
3. 自學(xué)能力強(qiáng):在數(shù)據(jù)分析的過(guò)程中需要經(jīng)常自行研究學(xué)習(xí)一些新的思路和方法,不斷修正,不斷更新。
二、 從入門(mén)到精通系統(tǒng)學(xué)習(xí)
CDA數(shù)據(jù)分析研究院師資團(tuán)提供的科學(xué)學(xué)習(xí)規(guī)劃如下:
1. 統(tǒng)計(jì)概率基礎(chǔ):數(shù)據(jù)分析行業(yè)分析,數(shù)據(jù)挖掘經(jīng)典流程,數(shù)據(jù)的描述性分析,數(shù)據(jù)的推斷性分析,方差分析,回歸分析,多元統(tǒng)計(jì)等系列理論課程,唯有掌握原理,方能駕馭工具。
2. 數(shù)據(jù)分析工具學(xué)習(xí):根據(jù)等級(jí)的要求,一般軟件在學(xué)術(shù)界和企業(yè)界的應(yīng)用廣泛程度為,學(xué)術(shù)界 :STATA >R > SPSS >SAS > Matlab; 商業(yè)界:EXCEL> PYTHON>SPSS> R>SAS。上手難度:SAS>PYTHON>R>SPSS>EXCEL工具的選擇不在于多,而在于跟具體問(wèn)題相結(jié)合,在學(xué)習(xí)的過(guò)程中可以選擇1-2門(mén)的工具進(jìn)行熟練使用。參考各大數(shù)據(jù)分析工具的區(qū)別。
3. 數(shù)據(jù)分析建模:利用工具進(jìn)行數(shù)據(jù)分析模型、數(shù)據(jù)挖掘算法建模運(yùn)用,常用的數(shù)據(jù)分析方法有(回歸分析法、主成分分析法、典型相關(guān)分析、因子分析法、判別分析法、聚類(lèi)分析法、結(jié)構(gòu)方程、Logistic模型等),常用的數(shù)據(jù)挖掘算法有(時(shí)間序列、Panel Data、關(guān)聯(lián)法則、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、遺傳算法)以及可視化技術(shù)。
4. 以上三部分皆為數(shù)據(jù)分析硬性技術(shù),要想熟能生巧需要經(jīng)常在學(xué)習(xí)和工作中運(yùn)用,不斷改善,不斷優(yōu)化模型,將技術(shù)與具體業(yè)務(wù)結(jié)合起來(lái),經(jīng)過(guò)長(zhǎng)時(shí)間的積累方能成為高級(jí)數(shù)據(jù)分析師。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10