
2018-12-06
CDA數(shù)據(jù)分析師和中國(guó)招商銀行的緣分開(kāi)始于2016年10月,那是我們第一次內(nèi)訓(xùn)合作,培訓(xùn)內(nèi)容是以CDA LEVEL 1-SPSS專(zhuān)題為標(biāo)準(zhǔn),為招行員工培訓(xùn)了數(shù)據(jù)統(tǒng)計(jì)方法、數(shù)據(jù)分析流程、SPSS操作技術(shù)、建模技術(shù)、案例分析等內(nèi)容,解決了員工技術(shù)短缺的問(wèn)題。那一次,我想對(duì)于招行來(lái)說(shuō),只是嘗試。
之后的2年里,感謝招行的信任,我們又進(jìn)行了《數(shù)據(jù)挖掘前沿理論與應(yīng)用》以及《復(fù)雜網(wǎng)絡(luò)分析基礎(chǔ)課程》2場(chǎng)內(nèi)訓(xùn)。
2018年11月,在招商銀行深圳綜合中小企業(yè)金融部,我們又一次相約。第四次,一定是因?yàn)楦咂焚|(zhì)造就好口碑。
此次的培訓(xùn)主題是《數(shù)據(jù)挖掘基礎(chǔ)》,由CDA數(shù)據(jù)分析院金牌講師李老師授課,李老師是國(guó)立臺(tái)灣大學(xué)資訊工程博士、銘傳大學(xué)大數(shù)據(jù)研究中心主任、中華資料采礦協(xié)會(huì)理事,其研究領(lǐng)域?qū)W⒂跀?shù)據(jù)倉(cāng)庫(kù)(Data Warehousing)、數(shù)據(jù)挖掘(Data Mining)、與文本挖掘。應(yīng)培訓(xùn)學(xué)員建議,上課時(shí)間定為周五周六的上午9點(diǎn)到晚上9點(diǎn),時(shí)間緊任務(wù)重,但是大家并沒(méi)有感覺(jué)厭煩疲憊。2天的時(shí)間里,李老師以及CDA的助教、內(nèi)訓(xùn)負(fù)責(zé)人與招行培訓(xùn)員工朝夕相處,不僅講授了知識(shí)技能,也對(duì)員工平時(shí)工作中所遇到的數(shù)據(jù)分析問(wèn)題做了的專(zhuān)業(yè)咨詢(xún)指導(dǎo)。
主題 | 企業(yè)使用范圍 | 理論介紹 |
數(shù)據(jù)挖掘基礎(chǔ) | 如何利用數(shù)據(jù)挖掘來(lái)進(jìn)行營(yíng)銷(xiāo)活動(dòng)及信用風(fēng)險(xiǎn)控管。 | 數(shù)據(jù)挖掘在政府部門(mén)及各行業(yè)的應(yīng)用 |
數(shù)據(jù)挖掘的起源、定義及目標(biāo) | ||
數(shù)據(jù)挖掘的發(fā)展歷程 | ||
數(shù)據(jù)庫(kù)中的知識(shí)發(fā)掘步驟(KDD) | ||
數(shù)據(jù)挖掘技術(shù)的產(chǎn)業(yè)標(biāo)準(zhǔn)(CRISP?DM) | ||
數(shù)據(jù)挖掘技術(shù)的功能分類(lèi) | ||
數(shù)據(jù)挖掘相關(guān)網(wǎng)站介紹(KDnuggets?&?Kaggle) | ||
IBM?SPSS?Modeler?&?WEKA實(shí)作 | ||
基礎(chǔ)數(shù)據(jù)挖掘及數(shù)據(jù)前處理技術(shù) | 如何利用數(shù)據(jù)前處理技術(shù)來(lái)進(jìn)行數(shù)據(jù)的重整,建置數(shù)據(jù)倉(cāng)庫(kù),以作為數(shù)據(jù)挖掘之輸入。 | 敘述性統(tǒng)計(jì)及可視化技術(shù) |
案例為本的學(xué)習(xí)(Case-based?Learning): | ||
KNN(K?Nearest?Neighbors) | ||
數(shù)據(jù)前處理(Data?Preprocessing)技術(shù) | ||
字段選擇(Attribute?Selection) | ||
數(shù)據(jù)清洗(Data?Cleansing) | ||
字段擴(kuò)充(Attribute?Enrichment) | ||
數(shù)據(jù)編碼(Data?Coding) | ||
IBM?SPSS?Modeler&?WEKA實(shí)作 | ||
進(jìn)階數(shù)據(jù)挖掘技術(shù)1 | 如何利用關(guān)鍵變量發(fā)掘技術(shù)來(lái)發(fā)掘?qū)?xiàng)目目標(biāo)有效之關(guān)鍵變量,以做為數(shù)據(jù)挖掘之輸入變量。 | 訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)的產(chǎn)生方法 |
無(wú)效變量 | ||
統(tǒng)計(jì)方式的變量選擇 | ||
模型方式的變量選擇 | ||
IBM?SPSS?Modeler?&?WEKA實(shí)作 | ||
進(jìn)階數(shù)據(jù)挖掘技術(shù)2 | 如何利用分類(lèi)技術(shù)之貝式網(wǎng)絡(luò)及決策樹(shù)來(lái)建立交叉銷(xiāo)售(Cross-Selling)模型,以提升公司獲利。 | 分類(lèi)之簡(jiǎn)單貝式網(wǎng)絡(luò)(Naive?Bayes)及貝式網(wǎng)絡(luò)(Bayes?Net) |
分類(lèi)之決策樹(shù)(Decision?Tree) | ||
分類(lèi)模型的評(píng)估 | ||
IBM?SPSS?Modeler?&?WEKA實(shí)作 | ||
進(jìn)階數(shù)據(jù)挖掘技術(shù)3 | 如何利用分類(lèi)技術(shù)之神經(jīng)網(wǎng)絡(luò)、羅吉斯回歸來(lái)建立信用評(píng)分(Credit?Scoring)模型,以降低公司損失。 | 分類(lèi)之神經(jīng)網(wǎng)絡(luò)(Neural?Network) |
分類(lèi)之羅吉斯回歸(Logistic?Regression) | ||
分類(lèi)模型的評(píng)估 | ||
IBM?SPSS?Modeler?&?WEKA實(shí)作 | ||
進(jìn)階數(shù)據(jù)挖掘技術(shù)4 | 如何利用更進(jìn)階的分類(lèi)技術(shù)來(lái)提升模型的分類(lèi)效能,增加公司獲利。 | 分類(lèi)之支持向量機(jī)(Support?Vector?Machine) |
分類(lèi)之多模型整合(Ensemble): | ||
裝袋(Bagging)、增強(qiáng)(Boosting)學(xué)習(xí) | ||
分類(lèi)之多模型整合(Ensemble): | ||
隨機(jī)森林(Random?Forest) | ||
IBM?SPSS?Modeler?&?WEKA實(shí)作 |
完 謝謝觀看