
CDA Level Ⅱ:建模分析師。兩年以上數(shù)據(jù)分析崗位工作經(jīng)驗(yàn),或通過(guò)CDA Level Ⅰ認(rèn)證半年以上。在政府、金融、電信、零售、互聯(lián)網(wǎng)、電商、醫(yī)學(xué)等行業(yè)專門從事數(shù)據(jù)分析與數(shù)據(jù)挖掘的人員。在Level Ⅰ的基礎(chǔ)之上深入掌握高級(jí)多元統(tǒng)計(jì)方法,并且拓展時(shí)間序列分析和主要數(shù)據(jù)挖掘的理論知識(shí)與業(yè)界運(yùn)用;能夠熟練使用SAS、R、Matlab和SPSS中至少一個(gè)專業(yè)統(tǒng)計(jì)軟件實(shí)現(xiàn)相關(guān)算法;熟悉使用SQL訪問(wèn)企業(yè)級(jí)數(shù)據(jù)庫(kù);具有按照數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程進(jìn)行項(xiàng)目需求分析、數(shù)據(jù)驗(yàn)證、建模與模型評(píng)估的能力。
級(jí)別 |
Level II |
理論 |
統(tǒng)計(jì)學(xué)、概率論和數(shù)理統(tǒng)計(jì)、多元統(tǒng)計(jì)分析、時(shí)間序列、數(shù)據(jù)挖掘(DM) |
軟件 |
必要:EXCEL、SQL、SAS/SPSS 可選:Python、R、MATLAB;SQL等(/表示“或”) |
分析方法要求 |
除掌握基本數(shù)據(jù)處理及分析方法以外,還應(yīng)掌握高級(jí)數(shù)據(jù)分析及數(shù)據(jù)挖掘方法(多元線性回歸法,生存分析法,神經(jīng)網(wǎng)絡(luò),決策樹,判別分析法,主成分分析法,因子分析法,典型相關(guān)分析,聚類分析法,關(guān)聯(lián)規(guī)則,支持向量機(jī),bagging,boosting等)和可視化技術(shù)。 |
業(yè)務(wù)分析能力 |
至少在客戶關(guān)系管理、管理會(huì)計(jì)、信用風(fēng)險(xiǎn)管理、人力資源管理等其中一個(gè)數(shù)據(jù)分析的常用領(lǐng)域內(nèi)具有深入的業(yè)務(wù)經(jīng)驗(yàn),可以將業(yè)務(wù)目標(biāo)轉(zhuǎn)化為數(shù)據(jù)分析目標(biāo);熟悉企業(yè)內(nèi)數(shù)據(jù)的生成過(guò)程,可以熟練的訪問(wèn)常見數(shù)據(jù)庫(kù);根據(jù)項(xiàng)目需求,以最快捷的方式獲取業(yè)界最新案例和學(xué)界最新研究成果,并且轉(zhuǎn)化為行動(dòng)方針;可以熟練的提取所需信息,能夠從海量數(shù)據(jù)中搜集并提取信息;根據(jù)項(xiàng)目目的,結(jié)合業(yè)務(wù)經(jīng)驗(yàn)選取最優(yōu)建模方法。 |
結(jié)果展現(xiàn)能力 |
報(bào)告體現(xiàn)數(shù)據(jù)挖掘的整體流程,層層闡述信息的收集、模型的構(gòu)建、結(jié)果的驗(yàn)證和解讀,對(duì)行業(yè)進(jìn)行評(píng)估,優(yōu)化和決策。 |
CDA Level Ⅱ培訓(xùn)課程大綱
詳細(xì)大綱
時(shí) 程 |
大綱內(nèi)容 |
第1天 |
主題:顧客關(guān)系管理及基礎(chǔ)數(shù)據(jù)挖掘技術(shù) |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用顧客關(guān)系管理來(lái)進(jìn)行營(yíng)銷活動(dòng) |
|
理論介紹: 顧客關(guān)系管理系統(tǒng)的架構(gòu)及其組成元素 企業(yè)如何利用顧客關(guān)系管理系統(tǒng)來(lái)進(jìn)行營(yíng)銷活動(dòng) 數(shù)據(jù)挖掘技術(shù)的功能分類 數(shù)據(jù)挖掘技術(shù)的績(jī)效增益 數(shù)據(jù)挖掘技術(shù)的產(chǎn)業(yè)標(biāo)準(zhǔn) 數(shù)據(jù)挖掘基本觀念與實(shí)際應(yīng)用解說(shuō) |
|
SAS EM & SPSS Modeler實(shí)務(wù)案例操作: Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16 Creating a EM Project, Library and Diagram Creating a SPSS Modeler Project |
|
第1天 第2天 |
主題:基礎(chǔ)數(shù)據(jù)挖掘技術(shù) |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用數(shù)據(jù)前處理技術(shù)來(lái)進(jìn)行數(shù)據(jù)的重整,建置數(shù)據(jù)倉(cāng)庫(kù),以做為數(shù)據(jù)挖掘之輸入 |
|
理論介紹: 數(shù)據(jù)挖掘技術(shù)的流程-SEMMA vs. CRISP DM 數(shù)據(jù)前處理(Data Preprocessing)技術(shù) Attribute Selection(字段選擇) *Data Integration(數(shù)據(jù)整合) Data Cleansing(數(shù)據(jù)清洗): *Wrong Value(錯(cuò)誤值), *Outlier(離群值), *Missing Value(遺失值) Attribute Enrichment(字段擴(kuò)充): *內(nèi)/外部數(shù)據(jù)的擴(kuò)充方法 Data Coding(數(shù)據(jù)編碼): *Data Transformation(數(shù)據(jù)轉(zhuǎn)換), *Data Reduction(數(shù)據(jù)精簡(jiǎn)), *Record Reduction(記錄精簡(jiǎn)), *Attribute Value Reduction(域值精簡(jiǎn)), *Attribute Reduction(字段精簡(jiǎn)) |
|
SAS EM & SPSS Modeler實(shí)務(wù)案例操作: Defining a Data Source Exploring a Data Source * Exploring Source Data * Changing the Explore Window Sampling Defaults * Modifying and Correcting Source Data Managing Wrong Values/Outliers/Missing Values Transforming Inputs Recording Categorical Inputs |
|
第2天 第3天 |
主題:進(jìn)階數(shù)據(jù)挖掘技術(shù) |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用關(guān)鍵變量發(fā)掘技術(shù)來(lái)發(fā)掘?qū)?xiàng)目目標(biāo)有效之關(guān)鍵變量,以做為數(shù)據(jù)挖掘之輸入變量 |
|
理論介紹: 訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)的產(chǎn)生方法 關(guān)鍵變量(Key Attributes)發(fā)掘技術(shù) *卡方檢定(Chi-square Test) *t檢定及ANOVA檢定(t Test & ANOVA Test) *利用決策樹(Decision Tree)選擇關(guān)鍵變量 |
|
SAS EM & SPSS Modeler實(shí)務(wù)案例操作: Creating Training & Validation Dataset Variable Selection Using Partial Least Squares for Input Selection Using the Decision Tree for Input Selection |
|
第3天 |
主題:進(jìn)階數(shù)據(jù)挖掘技術(shù)2 |
企業(yè)使用之范圍: 說(shuō)明如何利用分類技術(shù)之決策樹來(lái)建立交叉銷售(Cross-Selling)模型,以提升公司獲利 |
|
理論介紹: 分類之決策樹(Decision Tree) |
|
SAS EM & SPSS Modeler實(shí)務(wù)案例操作: Constructing a Decision Tree Model Optimizing the Complexity of Decision Trees Assessing a Decision Tree Understanding Additional Plots & Tables Automatic Tree Growth |
|
第3天 |
主題:進(jìn)階數(shù)據(jù)挖掘技術(shù)3 |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用分類技術(shù)之神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)及分類多模型整合來(lái)建立信用評(píng)分(Credit Scoring)模型,以降低公司損失 |
|
理論介紹: 分類之神經(jīng)網(wǎng)絡(luò)(Neural Network) 分類之支持向量機(jī)(Support Vector Machine) 分類多模型整合(Ensemble)之裝袋(Bagging)、增強(qiáng)(Boosting)學(xué)習(xí) |
|
SAS EM &SPSS Modeler實(shí)務(wù)案例操作: Training a Neural Network Selecting Neural Network Inputs Increasing Network Flexibility Using the AutoNeural Tool Constructing a Support Vector Machine Constructing Ensemble Models by Using Bagging and Boosting Techniques Model Comparisons |
|
第4天 |
主題:進(jìn)階數(shù)據(jù)挖掘技術(shù)4 |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用模型評(píng)估技術(shù)來(lái)評(píng)估模型的優(yōu)劣,以作為采用適當(dāng)模型的準(zhǔn)則 |
|
理論介紹: 模型評(píng)估(Model Assessment)技術(shù) |
|
SAS EM & SPSS Modeler實(shí)務(wù)案例操作: Model Fit Statistics: * Comparing Models with Summary Statistics Statistical Graph: * Comparing Models with ROC Charts * Comparing Models with Score Rankings Plots * Adjusting for Separate Sampling Profit Matrix: * Evaluating Model Profit * Viewing Additional Assessments * Optimizing with Profit Internally Scored Data Sets: * Creating a Score Data Source * Scoring with the Score Tool * Exporting a Scored Table Score Code Modules: * Creating a SAS Score Code Module * Creating Other Score Code Modules |
|
第4天 |
主題:進(jìn)階數(shù)據(jù)挖掘技術(shù)5 |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用預(yù)測(cè)(Prediction)技術(shù)之回歸樹及類神經(jīng)網(wǎng)絡(luò)來(lái)建立數(shù)值預(yù)測(cè)模型-如預(yù)測(cè)客戶之年收入,以利公司設(shè)計(jì)營(yíng)銷活動(dòng) |
|
理論介紹: 回歸樹(Regression Tree) 類神經(jīng)網(wǎng)絡(luò)(Neural Network)-非線性回歸 |
|
SAS EM & SPSS Modeler實(shí)務(wù)案例操作: Review and Set the Decision Tree Node Review and Set the Neural Network Node |
|
第4天 |
主題:進(jìn)階數(shù)據(jù)挖掘技術(shù)6 |
企業(yè)使用之范圍: 說(shuō)明企業(yè)如何利用關(guān)聯(lián)及序列分析技術(shù)來(lái)建立交叉銷售(Cross-Selling)及提升銷售(Up-Selling)模型,以提升公司獲利 |
|
理論介紹: 關(guān)聯(lián)分析(Association Analysis) 序列分析(Sequence Analysis) |
|
SAS EM & SPSS Modeler案例案例操作: Consolidating Categorical Inputs Market Basket Analysis Sequence Analysis |
|
第5天 |
環(huán)境搭建與數(shù)據(jù)轉(zhuǎn)換
|
主體:數(shù)據(jù)分析環(huán)境搭建 1、Python程序安裝 2、MySQL數(shù)據(jù)庫(kù)安裝、配置、建庫(kù);
|
|
主題:Python與其它軟件之間數(shù)據(jù)轉(zhuǎn)換 1、Python內(nèi)部的數(shù)據(jù)存儲(chǔ)類型 2、Python與CSV格式文件; 3、Python與EXCEL格式文件; 4、Python與MySQL; 5、Python與ODBC;
|
|
主題:用R作統(tǒng)計(jì) 兩變量相關(guān)檢驗(yàn)(兩樣本T檢驗(yàn)、方差分析、卡方檢驗(yàn)、相關(guān)檢驗(yàn)); 主成分與因子分析; |
|
|
數(shù)據(jù)挖據(jù)完整流程案例 ——Python編程構(gòu)造銀行信用風(fēng)險(xiǎn)模型 |
第6天 |
主題:信用風(fēng)險(xiǎn)建模簡(jiǎn)介 銀行信用風(fēng)險(xiǎn)監(jiān)管體系與信用風(fēng)險(xiǎn)內(nèi)部模型 主題:?jiǎn)巫兞繖z驗(yàn)與數(shù)據(jù)清洗 缺失值檢驗(yàn)與處理方法 異常值檢驗(yàn)與處理方法 解釋變量粗篩 雙變量關(guān)系檢驗(yàn)法 數(shù)據(jù)分箱 |
主題:連續(xù)變量壓縮技術(shù) 變量聚類 分類變量壓縮技術(shù) 似完整分類數(shù)據(jù)問(wèn)題 WOE方法 主題:邏輯回歸建模技術(shù) 模型選擇:逐步法、全子集法 根據(jù)經(jīng)驗(yàn)Logit曲線進(jìn)行連續(xù)變量轉(zhuǎn)換 主題:編程模型評(píng)估技術(shù) ROC曲線 K-S曲線 |
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03