
2018-06-08
2018年5月23-25日,CDA數(shù)據(jù)分析研究院在中國(guó)電信股份有限公司北京研究院進(jìn)行了一場(chǎng)以“人工智能之Python應(yīng)用”為主題的內(nèi)訓(xùn)。中心各部門員工報(bào)名積極,共有70名員工參加了集中培訓(xùn)。老師和數(shù)據(jù)分析部門的相關(guān)同事進(jìn)行積極地交流,本次內(nèi)訓(xùn)取得圓滿成功。
內(nèi)訓(xùn)內(nèi)容簡(jiǎn)介
第一天: Python 編程基礎(chǔ)(均通過實(shí)際案例講解)
1. 語(yǔ)法初步
2. 數(shù)據(jù)結(jié)構(gòu)(列表、字符串、元組、集合、字典和字符串)
3. 條件選擇結(jié)構(gòu)和循環(huán)結(jié)構(gòu)(隨機(jī)模擬)
4. 若干重要內(nèi)置函數(shù)應(yīng)用
5. 函數(shù)、模塊及其應(yīng)用
6. 數(shù)組的使用
7. 文件的操作
8. 排序和查找、遞歸算法
9. 正則表達(dá)式簡(jiǎn)介
10. 面向?qū)ο缶幊毯?jiǎn)介
第二天:使用numpy、pandas等進(jìn)行數(shù)據(jù)清洗和整理,統(tǒng)計(jì)分析
1. 整理數(shù)據(jù)(切片、產(chǎn)生隨機(jī)數(shù)、復(fù)制、廣播、排序等)
2. 數(shù)據(jù)索引和選擇的各種方法
3. 數(shù)據(jù)的分組、分割、合并、變形
4. 文本數(shù)據(jù)的處理技巧
5. 抽樣分布和假設(shè)檢驗(yàn)(含非參數(shù)假設(shè)檢驗(yàn))
6. 線性模型的構(gòu)建和預(yù)測(cè)(含回歸分析、離散因變量模型)
7. 主成份分析和因子分析
8. 列聯(lián)表和對(duì)應(yīng)分析
9. 時(shí)間序列數(shù)據(jù)處理、建模和預(yù)測(cè)(ARIMA)
第三天:Python機(jī)器學(xué)習(xí)算法和數(shù)據(jù)挖掘案例實(shí)戰(zhàn)
1. 概率、逼近和EM算法原理和實(shí)例
2. 最近鄰k-NN算法及應(yīng)用實(shí)例(客戶細(xì)分、數(shù)碼圖像識(shí)別)
3. 樸素貝葉斯(Naive Bayes)算法
4. 使用scikit-learn模塊進(jìn)行機(jī)器學(xué)習(xí)的若干案例(含回歸、決策樹、支持向量機(jī)、梯度下降、集成學(xué)習(xí)、隨機(jī)森林等多種算法模型)
5. k-means聚類(無(wú)監(jiān)督學(xué)習(xí)、如何確定最佳聚類數(shù))
6. 特征工程及變量的選擇
7. 使用XGBoost 進(jìn)行預(yù)測(cè)的經(jīng)典案例(交叉驗(yàn)證、格點(diǎn)搜索、參數(shù)尋優(yōu))
8. 再談Logistic回歸和案例分析
9. 文本挖掘原理和案例(分詞、TF-IDF準(zhǔn)則、文本分類、非結(jié)構(gòu)化數(shù)據(jù)分析)
10. 深度學(xué)習(xí)原理及其若干應(yīng)用案例
參訓(xùn)員工心得與評(píng)價(jià)
本次培訓(xùn)內(nèi)容豐富,基本涵蓋機(jī)器學(xué)習(xí)常用算法和技能,正是項(xiàng)目應(yīng)用需要的。知識(shí)點(diǎn)比較多,拓展了自己的數(shù)據(jù)思維,對(duì)數(shù)據(jù)方法更深入了解,并且提升了動(dòng)手實(shí)踐能力。先消化一段時(shí)間,希望后期與CDA數(shù)據(jù)分析研究院在專題類課程有更多交流和學(xué)習(xí)。
完 謝謝觀看