
2013年是大數(shù)據(jù)元年,在美國,大數(shù)據(jù)的應(yīng)用正在各個行業(yè)風生水起,大至奧巴馬競選總統(tǒng),小至互聯(lián)網(wǎng)公司的數(shù)據(jù)挖掘。2014年,數(shù)據(jù)挖掘技術(shù)已經(jīng)廣泛應(yīng)用于通訊、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科研、教育等多個行業(yè)和領(lǐng)域。
為追隨數(shù)據(jù)時代的到來,人大經(jīng)濟論壇將于暑期8月開設(shè)系列數(shù)據(jù)挖掘特訓班。
分為兩大類《基于SAS和weka的商業(yè)數(shù)據(jù)挖掘》和《基于SPSS Modeler的數(shù)據(jù)挖掘案例實務(wù)》
課程 |
時間 |
地點 |
價格 |
報名 |
基于SAS和weka的商業(yè)數(shù)據(jù)挖掘 |
8.2-3,9-10 |
北京,對外經(jīng)貿(mào)大學 |
5000/4000學生 |
|
基于SPSS Modeler的數(shù)據(jù)挖掘案例實務(wù) |
8.14-17 |
北京,對外經(jīng)貿(mào)大學 |
4000/2500學生 |
|
全程合報 |
8.2-3,9-10, 14-17 |
北京,對外經(jīng)貿(mào)大學 |
8000/5500學生 |
基于SAS和weka的大數(shù)據(jù)商業(yè)數(shù)據(jù)挖掘
課程內(nèi)容及目標:
內(nèi)容包含:
1. 數(shù)據(jù)挖掘的基本知識;
2. 數(shù)據(jù)挖掘常用工具的使用與操作;
3. 具體應(yīng)用案例介紹;
4. 最新熱點趨勢。
目的:
讓大家在大數(shù)據(jù)時代背景下,用最短的時間快速掌握數(shù)據(jù)挖掘的工具,從商用大數(shù)據(jù)中挖掘有用的信息與數(shù)據(jù)的價值,實現(xiàn)商業(yè)模式的創(chuàng)新與完善。
課程特點:
(1)課程中穿插實際案例,從基礎(chǔ)到應(yīng)用,由淺入深,通俗易懂;每一章節(jié)都配備有足夠的案例和數(shù)據(jù)分析,保證大家能夠掌握數(shù)據(jù)挖掘的基本操作。
(2)現(xiàn)場演示基于數(shù)據(jù)挖掘工具軟件SAS/Weka軟件的數(shù)據(jù)挖掘操作,,并免費給大家提供常用的數(shù)據(jù)挖掘工具包和數(shù)據(jù)挖掘數(shù)據(jù)集。
(3)講義以美國著名商學院的數(shù)據(jù)挖掘教材為基礎(chǔ),精選出對目前對符合國內(nèi)大數(shù)據(jù)應(yīng)用情況的內(nèi)容,同時結(jié)合主講人對大數(shù)據(jù)前沿問題最新研究成果和實戰(zhàn)經(jīng)驗編寫而成。
(4)內(nèi)容分為基礎(chǔ)篇和應(yīng)用篇:基礎(chǔ)篇強調(diào)數(shù)據(jù)挖掘基本知識和基本技術(shù)的掌握;應(yīng)用篇則將數(shù)據(jù)挖掘和實際應(yīng)用聯(lián)系起來,講授數(shù)據(jù)挖掘在真正的商業(yè)環(huán)境中的應(yīng)用。
課程大綱:
一、基礎(chǔ)篇(授課時間為兩天): 數(shù)據(jù)挖掘基礎(chǔ)+小規(guī)模數(shù)據(jù)挖掘的應(yīng)用實例
(1) 數(shù)據(jù)挖掘概述
1.1) 大數(shù)據(jù)時代的數(shù)據(jù)挖掘
1.2) 數(shù)據(jù)挖掘的經(jīng)典案例
1.3) 數(shù)據(jù)挖掘實現(xiàn)的十步法
1.4) 數(shù)據(jù)挖掘的研發(fā)利器及比較:SAS/Weka,Matlab,C++, Java, R, SPSS)
(2) 四大傳統(tǒng)數(shù)據(jù)挖掘方法及典型應(yīng)用案例演示
2.1)聚類分析(Clustering analysis)及其在客戶細分中的應(yīng)用
2.2) 分類分析(Classification analysis)及其在文檔分析中的應(yīng)用
2.3) 關(guān)聯(lián)規(guī)則(Association rule)及其在商場購物促銷中的應(yīng)用
2.4)預(yù)測分析及其及客戶流失中的應(yīng)用;
2.5)四大傳統(tǒng)數(shù)據(jù)挖掘算法應(yīng)用的實際操作
(3) 面向大數(shù)據(jù)的數(shù)據(jù)挖掘之一: 文本挖掘及互聯(lián)網(wǎng)海量數(shù)據(jù)分析的應(yīng)用
3.1)文本大數(shù)據(jù)挖掘的基本步驟,和傳統(tǒng)挖掘的區(qū)別及難點剖析
3.2) 文本挖掘的前沿技術(shù)應(yīng)用實例:網(wǎng)頁分析及輿情發(fā)現(xiàn)
3.3)大數(shù)據(jù)時代其它非結(jié)構(gòu)化數(shù)據(jù)(圖像、語音、視頻、傳感數(shù)據(jù)等)挖掘及其應(yīng)用,例如圖像檢索
(4)面向大數(shù)據(jù)的數(shù)據(jù)挖掘之二:基于復雜網(wǎng)絡(luò)的數(shù)據(jù)挖掘及其在社交網(wǎng)絡(luò)分析上的應(yīng)用
4.1)復雜網(wǎng)絡(luò)分析:典型的大數(shù)據(jù)模型
4.2)社交網(wǎng)絡(luò)的應(yīng)用:朋友圈發(fā)現(xiàn)和社交搜索(Graph search)
4.3) 排列分析(Ranking analysis)及在網(wǎng)絡(luò)搜索中的應(yīng)用
4.5)一圖勝千言(A picture is more than one thousand words):挖掘結(jié)果的可視化實現(xiàn)
(5)數(shù)據(jù)挖掘商業(yè)應(yīng)用實例
5.1)利用數(shù)據(jù)挖掘進行欺詐檢測
5.2)商品銷售中推薦系統(tǒng) (Recommending system) 的基本原理
5.3)推薦系統(tǒng)的應(yīng)用
(6)大數(shù)據(jù)時代的機遇與挑戰(zhàn)
6.1)對大數(shù)據(jù)(big data )時代的理解
62)大數(shù)據(jù)技術(shù)掃描:從基礎(chǔ)設(shè)施、軟件平臺,計算模式到挖掘模型
6.3)大數(shù)據(jù)會給我們帶來什么改變:機遇和挑戰(zhàn)
二、應(yīng)用篇(授課時間為兩天):在真實的商業(yè)環(huán)境的應(yīng)用,對真實的大數(shù)據(jù)進行挖掘
(1) 高級數(shù)據(jù)挖掘知識:數(shù)據(jù)降維、集成學習等
(2) 金融領(lǐng)域風險預(yù)測評分,數(shù)據(jù)來源:國外某跨國商業(yè)銀行
(3) 電子商務(wù)大規(guī)模推薦系統(tǒng)的應(yīng)用,數(shù)據(jù)來源:國內(nèi)最大的電子商務(wù)網(wǎng)站之一
(4) 復雜網(wǎng)絡(luò)分在信息科學以及金融的應(yīng)用,數(shù)據(jù)來源:路透社和某國有大型銀行
(5) 文本挖掘及其應(yīng)用,數(shù)據(jù)來源:路透社和PUMED數(shù)據(jù)庫
(6) 基于大數(shù)據(jù)平臺下的數(shù)據(jù)挖掘具體實現(xiàn)簡介,基于阿里巴巴的ODPS平臺
基礎(chǔ)+應(yīng)用,最系統(tǒng)最全面的數(shù)據(jù)挖掘課程!
Number2:
基于SPSS Modeler的數(shù)據(jù)挖掘案例實務(wù)
培訓時間: 2014年8月14-17日(4天)@北京,對外經(jīng)貿(mào)大學 授課安排: (1) 授課方式:中文多媒體互動式授課方式 (2) 授課時間:上午9:00-12:00,下午13:30-16:30(16:30-17:00答疑) (3) 所有軟件:SPSS Modeler 邀請函下載: 數(shù)據(jù)挖掘班邀請函 訪問碼:ec01 |
講師介紹:
李御璽 (Yue-Shi Lee),國立臺灣大學計算機工程博士,銘傳大學計算機工程學系教授兼系主任暨所長,銘傳大學數(shù)據(jù)挖掘中心主任,廈門大學數(shù)據(jù)挖掘中心顧問,中國人民大學數(shù)據(jù)挖掘中心顧問。其研究領(lǐng)域?qū)W⒂?a href='/map/shujucangku/' style='color:#000;font-size:inherit;'>數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、與文本挖掘。
在其相關(guān)研究領(lǐng)域已發(fā)表超過260篇以上的研究論文,同時也是國科會與教育部多個相關(guān)研究計劃的主持人。服務(wù)過的客戶包括:中國工商局、中信銀行、臺新銀行、聯(lián)邦銀行、新光銀行、 新竹國際商業(yè)銀行(現(xiàn)已并入渣打銀行)、第一銀行、永豐銀行、遠東銀行、美商大都會人壽、嘉義基督教醫(yī)院、臺灣微軟、零售業(yè)如赫蓮娜(Helena Rubinstein)化妝品公司、特立和樂(HOLA)公司、航空公司如東方航空公司、中華航空公司、汽車行業(yè)如福特(Ford)汽車公司;ZF行業(yè)如國稅局等。
課程大綱:
案例1:Drug Treatments: In this case, imagine that you are a medical researcher compiling data for a study. You have collected data about a set of patients, all of whom suffered from the same illness. During their course of treatment, each patient responded to one of five medications. Part of your job is to use data mining to find out which drug might be appropriate for a future patient with the same illness.
藥物治療(醫(yī)療業(yè)):在這個案例中,想象你是一個醫(yī)學研究人員,并收集許多患有相同疾病的病患資料。在他們的治療過程中,每一個病人會被記錄對哪一種藥物有療效(總共有五種針對此疾病的藥物)。此案例的目的是想利用數(shù)據(jù)挖掘(分類模型-多目標決策樹(Decision Tree))找出,哪種藥物適用于哪一種類型的病人。
案例2:Modeling Customer Response: This case is based on a company that wants to achieve more profitable results in future marketing campaigns by matching the right offer to each customer. Specifically, this case identifies the characteristics of customers who are most likely to respond, based on previous promotions, and generates a mailing list based on the results.
對客戶響應(yīng)建模(零售業(yè)):本案例是某公司希望通過提供客戶對的營銷活動,在未來實現(xiàn)更多的獲利。此案例的目的是想根據(jù)以往的促銷活動,利用數(shù)據(jù)挖掘(分類模型-決策列表(Decision List))找出會對營銷活動有響應(yīng)的客戶特征,并根據(jù)建模的結(jié)果產(chǎn)生要郵寄的促銷客戶名單。
案例3:Classifying Telecommunications Customers: Suppose a telecommunications provider has segmented its customer base by service usage patterns, categorizing the customers into four groups. If demographic data can be used to predict group membership, you can customize offers for individual prospective customers.
:電信客戶分類(電信業(yè)):假設(shè)某電信服務(wù)提供商通過客戶使用服務(wù)的方式,將客戶分為四類人。此案例的目的是想根據(jù)人口統(tǒng)計數(shù)據(jù)(分類模型-多目標羅吉斯回歸(Multinomial Logistic Regression)),利用數(shù)據(jù)挖掘找出這四類人的特征,并發(fā)掘這四類人的潛在新客戶。
案例4:Telecommunications Churn: Suppose a telecommunications provider is concerned about the number of customers it is losing to competitors. If service usage data can be used to predict which customers are liable to transfer to another provider, offers can be customized to retain as many customers as possible. This example focuses on using usage data to predict customer loss (churn).
電信客戶流失(電信業(yè)):假設(shè)某電信服務(wù)提供商非常關(guān)注客戶流失到競爭對手的數(shù)量。假如服務(wù)使用的數(shù)據(jù)可以用來預(yù)測哪些客戶有可能被轉(zhuǎn)移到另一個供貨商,則此供貨商可提供客制化的優(yōu)惠,以盡可能留住客戶。此案例的目的是想根據(jù)服務(wù)使用的數(shù)據(jù),利用數(shù)據(jù)挖掘(分類模型-二元羅吉斯回歸(Binomial Logistic Regression))來預(yù)測客戶的流失。
案例5:Forecasting Bandwidth Utilization: An analyst for a national broadband provider is required to produce forecasts of user subscriptions in order to predict utilization of bandwidth. Forecasts are needed for each of the local markets that make up the national subscriber base. This example will use time series modeling to produce forecasts for the next three months for a number of local markets.
預(yù)測帶寬使用率(通訊業(yè)):某全國寬帶網(wǎng)絡(luò)供貨商的分析師需進行客戶使用網(wǎng)絡(luò)的預(yù)估,以便預(yù)測帶寬的使用。全國網(wǎng)絡(luò)的使用是全國各局域網(wǎng)絡(luò)使用的加總,因此分析師需逐一對給個區(qū)域市場進行帶寬使用的預(yù)測。此案例的目的是想利用數(shù)據(jù)挖掘中的時間序列模型(預(yù)測模型-簡單時間序列(Simple Time Series))來預(yù)測每個區(qū)域市場下三個月的帶寬使用量。
案例6:Forecasting Catalog Sales: A catalog company is interested in forecasting monthly sales of its men’s clothing line, based on their sales data for the last 10 years. This example takes a closer look at the two methods that are available when choosing a model yourself—exponential smoothing and ARIMA.
預(yù)測型錄商品的銷售(零售業(yè)):某型錄公司希望根據(jù)過去10年的銷售記錄,利用數(shù)據(jù)挖掘來預(yù)測男裝生產(chǎn)線每月的銷售。此案例的目的是想利用數(shù)據(jù)挖掘中的兩個時間序列模型-Exponential Smoothing和ARIMA(預(yù)測模型-復雜時間序列(Exponential Smoothing & ARIMA))來解決這個問題。
案例7:Making Offers to Customers: This example teaches you how to predict which offers are most appropriate for customers and the probability of the offers being accepted. These sorts of models are most beneficial in customer relationship management, such as marketing applications or call centers.
提供對的產(chǎn)品給對的客戶(銀行業(yè)):此案例的目的是想利用數(shù)據(jù)挖掘(分類模型-自學響應(yīng)模型(Self-Learning Response Model))來預(yù)測客戶對不同產(chǎn)品報價的接受程度,以便預(yù)測哪些產(chǎn)品適合提供給哪些客戶。此類模型適合運用在顧客關(guān)系管理中的目標市場營銷及客服中心。
案例8:Predicting Loan Defaulters: Suppose a bank is concerned about the potential for loans not to be repaid. If previous loan default data can be used to predict which potential customers are liable to have problems repaying loans, these “bad risk” customers can either be declined a loan or offered alternative products.
預(yù)測貸款逾期者(銀行業(yè)):某銀行希望根據(jù)客戶過去的貸款數(shù)據(jù),利用數(shù)據(jù)挖掘(分類模型-貝式網(wǎng)絡(luò)(Bayesian Network))來預(yù)測新的貸款者,核貸后會逾期的機率,以做為銀行是否核貸的依據(jù),或提供給客戶其他類型的貸款產(chǎn)品。
案例9:Retail Sales Promotion: This example deals with data that describes retail product lines and the effects of promotion on sales. The goal of this example is to predict the effects of future sales promotions.
零售業(yè)銷售促銷(零售業(yè)):此案例的目的是想根據(jù)零售產(chǎn)品過去的促銷記錄,利用數(shù)據(jù)挖掘(預(yù)測模型-神經(jīng)網(wǎng)絡(luò)及回歸樹(Neural Network & Regression Tree))來預(yù)測未來的銷售成效。
案例10:Condition Monitoring: This example concerns monitoring status information from a machine and the problem of recognizing and predicting fault states. The data consists of a number of concatenated series measured over time. Each record is a snapshot report on the machine.
狀態(tài)監(jiān)測(信息業(yè)):此案例的目的是想根據(jù)機器監(jiān)控狀態(tài)的信息,利用數(shù)據(jù)挖掘(分類模型-神經(jīng)網(wǎng)絡(luò)及決策樹(Neural Network & Decision Tree))來預(yù)測機器發(fā)生故障的機率。此案例的數(shù)據(jù)包含在時間軸上連續(xù)的機器監(jiān)控狀態(tài)信息。因此,每一筆記錄是機器在某個時間點的狀態(tài)報告。
案例11:Classifying Cell Samples: A medical researcher has obtained a dataset containing characteristics of a number of human cell samples extracted from patients who were believed to be at risk of developing cancer. Analysis of the original data showed that many of the characteristics differed significantly between benign and malignant samples. The researcher wants to develop a model to give an early indication of whether their samples might be benign or malignant.
細胞樣本分類(醫(yī)療業(yè)):某醫(yī)學研究中心收集癌癥病患的細胞樣本特征數(shù)據(jù),以便進行研究。原始的數(shù)據(jù)顯示良性樣本與惡性樣本間的許多特征有顯著的差異。此案例的目的是想根據(jù)此數(shù)據(jù),利用數(shù)據(jù)挖掘(分類模型-支持向量機(Support Vector Machine))來提早發(fā)現(xiàn)某樣本是良性還是惡性的樣本。
案例12:Market Basket Analysis: This example deals with data describing the contents of supermarket baskets (that is, collections of items bought together) plus the associated personal data of the purchaser, which might be acquired through a loyalty card scheme. The goal is to discover groups of customers who buy similar products and can be characterized demographically, such as by age, income, and so on.:
購物籃分析(零售業(yè)):此案例的目的是想根據(jù)會員卡所記錄的客戶的個人信息及每次購買商品的數(shù)據(jù),利用數(shù)據(jù)挖掘(關(guān)聯(lián)模型-Apriori &決策樹(Decision Tree))來發(fā)掘購買類似商品的客群,以及客群的特征(例如,年齡、收入、等)。
12個真實案例玩轉(zhuǎn)數(shù)據(jù)挖掘!
(詳情請參照:http://bbs.pinggu.org/thread-3019568-1-1.html)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03