99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁案例分享圖書銷售綜合分析
圖書銷售綜合分析
2021-03-08
收藏

一、案例綜述

案例編號(hào):

101004

案例名稱:

零售行業(yè)——圖書銷售綜合分析

作者姓名(或單位、或來源):

劉莎莎

案例所屬行業(yè):

h65 零售行業(yè)

案例所用軟件:

Sas EG

案例包含知識(shí)點(diǎn):

因子分析  度量尺度變量轉(zhuǎn)化為有序尺度變量、對(duì)應(yīng)分析回歸分析   OLS  VIF  方差膨脹因子 多重共線性個(gè)案選擇  logistic回歸分析   二元選擇模型  離散因變量模型 逐步回歸 多重貢獻(xiàn)性 樣本外預(yù)測  樣本內(nèi)預(yù)測 模型預(yù)測 隨機(jī)選擇樣本  過濾變量的生成

案例描述:

零售行業(yè)銷售數(shù)據(jù)分析的行業(yè)背景。要想在如今的零售環(huán)境中獲得成功,零售商必須提供卓越的客戶體驗(yàn),出色地運(yùn)營業(yè)務(wù),并創(chuàng)建一個(gè)需求驅(qū)動(dòng)的行銷和供應(yīng)鏈。他們必須滿足越來越兩極化和專業(yè)化的客戶需求,這些客戶對(duì)于服務(wù)、選擇、質(zhì)量和價(jià)格都抱有很高的期望。而且,他們必須對(duì)超出他們控制范圍的因素做出響應(yīng),這些因素包括競爭威脅、宏觀經(jīng)濟(jì)趨勢和新興技術(shù)等。

建立零售行業(yè)基礎(chǔ)有效數(shù)據(jù)分析可以更透徹地了解客戶行為和購買模式,洞悉消費(fèi)者的消費(fèi)偏好,創(chuàng)造向上銷售和交叉銷售機(jī)遇;優(yōu)化行銷水平,盡可能減少脫銷情況,并管理庫存成本;深入了解關(guān)鍵店鋪級(jí)指標(biāo),例如,銷售額、勞動(dòng)力、庫存和客戶滿意度等;在關(guān)鍵收入和盈利能力目標(biāo)方面協(xié)調(diào)公司和店鋪運(yùn)營,當(dāng)市場條件變化時(shí),快速調(diào)整計(jì)劃和資源分配;通過比較和基準(zhǔn)測試店鋪、渠道、地區(qū)和部門間的績效,提高成本節(jié)約;監(jiān)控營業(yè)額和員工生產(chǎn)力。

    案例通過分析某書店圖書銷售情況,了解圖書銷售的主要影響因素。

    數(shù)據(jù)文件說明:數(shù)據(jù)文件名字為bookcustomer.xlsx。該數(shù)據(jù)集記錄的是一個(gè)圖書城的書籍購買記錄。每一個(gè)訂單的記錄記為一行,包括客戶編號(hào)、性別、郵編、距首次購買的月數(shù)、距最后一次購買的月數(shù)、在圖書上的總消費(fèi)、非書籍產(chǎn)品總消費(fèi)、總消費(fèi)、總購買(書籍本書)、購買書籍的分類本數(shù)。該數(shù)據(jù)集共有50000條觀測值。

本案例共包含八個(gè)知識(shí)點(diǎn)。

1個(gè)知識(shí)點(diǎn)是Saseg邏輯庫的建立和數(shù)據(jù)的導(dǎo)入,將數(shù)據(jù)導(dǎo)入saseg。

然后第2個(gè)知識(shí)點(diǎn)用函數(shù)生成新的變量(地區(qū)變量和城市變量),從而方便進(jìn)行后續(xù)的計(jì)算和分析;

3個(gè)知識(shí)點(diǎn)是地區(qū)變量的頻數(shù)統(tǒng)計(jì)和總消費(fèi)量的分地區(qū)描述統(tǒng)計(jì),從而對(duì)數(shù)據(jù)進(jìn)行一個(gè)基本的描述統(tǒng)計(jì)分析;

4個(gè)知識(shí)點(diǎn)是對(duì)消費(fèi)者各類圖書購買數(shù)量進(jìn)行相關(guān)性分析從而知道哪些書籍具有相關(guān)性;

5個(gè)知識(shí)點(diǎn)是用RFM模型進(jìn)行客戶畫像,從而起到對(duì)客戶進(jìn)行分群的目的,以便采用不同的營銷策略;

6個(gè)知識(shí)點(diǎn)是客戶總消費(fèi)的影響因素分析,檢驗(yàn)?zāi)男┳兞繉?duì)客戶總消費(fèi)額的影響是顯著的。

7個(gè)知識(shí)點(diǎn)是對(duì)書籍購買本數(shù)的分類求和 ,從而知道哪類書的銷售量最高,哪類書的銷售量最低,發(fā)現(xiàn)h類書籍的銷售量(本數(shù))最低。

8個(gè)知識(shí)點(diǎn)是關(guān)于是否購買h類書的Logistic回歸模型,從而知道哪些因素對(duì)購買h類書的決策產(chǎn)生影響,進(jìn)而提高h類書的銷售量。

案例執(zhí)行形式

單人上機(jī)


二、案例知識(shí)點(diǎn)

知識(shí)點(diǎn)1

知識(shí)點(diǎn)名稱:Saseg邏輯庫的建立和數(shù)據(jù)的導(dǎo)入

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)導(dǎo)入

知識(shí)點(diǎn)背景:

先要將外部數(shù)據(jù)導(dǎo)入到統(tǒng)計(jì)軟件中才能進(jìn)行后續(xù)的分析和建模。

知識(shí)點(diǎn)描述

excel數(shù)據(jù)導(dǎo)入到saseg中,并且將數(shù)據(jù)保存為sas格式。

知識(shí)點(diǎn)關(guān)鍵詞:

Excel導(dǎo)入saseg     數(shù)據(jù)導(dǎo)入

知識(shí)點(diǎn)所用軟件:

Saseg

操作目的:

excel數(shù)據(jù)導(dǎo)入到saseg中。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

bookcustomer.xlsx

操作步驟:

? 打開excel文件,查看數(shù)據(jù)是否符合SAS要求的格式;

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱,點(diǎn)擊“下一步”按鈕

在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑,單擊“下一步”按鈕;

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了,接下來開始導(dǎo)入數(shù)據(jù);

? 執(zhí)行“文件”“導(dǎo)入數(shù)據(jù)”,選擇數(shù)據(jù)所在文件夾,選中要打開的數(shù)據(jù),點(diǎn)擊“打開”按鈕。在導(dǎo)入數(shù)據(jù)向?qū)У谝徊剑瑢⑤敵鯯AS數(shù)據(jù)集的邏輯庫改為上一步建立的永久邏輯庫,點(diǎn)擊“下一步”按鈕;勾選使用工作表中特定范圍內(nèi)的單元格,選擇單元格范圍,左上方單元

填A(yù)2,右下方單元格選默認(rèn),勾選首行范圍包含字段名稱,點(diǎn)擊“下一步”按鈕;查看字段屬性,若有不符合原數(shù)據(jù)特征的,進(jìn)行修改,并為數(shù)據(jù)加上漢語標(biāo)簽,點(diǎn)擊“下一步”按鈕;點(diǎn)擊“完成”按鈕。

 

操作結(jié)果:

將上面生成的sas數(shù)據(jù)文件保存在文件夾中存為bookcustomer.sas7bdat,以備后續(xù)使用。

知識(shí)點(diǎn)小結(jié):

想把excel格式數(shù)據(jù)導(dǎo)入到saseg中,先要將excel數(shù)據(jù)格式整理成比較標(biāo)準(zhǔn)的格式才不容易出錯(cuò)。

知識(shí)點(diǎn)2

知識(shí)點(diǎn)名稱:用函數(shù)生成新的變量(地區(qū)變量和城市變量)

知識(shí)點(diǎn)所屬工作角色:

變量計(jì)算

知識(shí)點(diǎn)背景:

有些指標(biāo)不能直接參與數(shù)據(jù)分析過程需要對(duì)其進(jìn)行計(jì)算整理生成新的變量。

知識(shí)點(diǎn)描述

采用函數(shù)對(duì)變量進(jìn)行計(jì)算生成新的變量。

知識(shí)點(diǎn)關(guān)鍵詞:

變量計(jì)算  函數(shù)  變量名標(biāo)簽

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

對(duì)變量進(jìn)行計(jì)算生成新的變量并且給變量添加中文標(biāo)簽。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

bookcustomer.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕;

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer.sas7bdat這個(gè)文件),單擊“下一步”按鈕;

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 

右鍵點(diǎn)擊bookconsumer的圖標(biāo),選擇“查詢生成器”(在數(shù)據(jù)表下打開“查詢生成器”)。

 

t1表中的數(shù)據(jù)全部拖入右側(cè),選擇數(shù)據(jù)部分。

 

點(diǎn)擊“計(jì)算列”,點(diǎn)擊“新建”按鈕;

“選擇類型”中點(diǎn)選“高級(jí)表達(dá)式”,點(diǎn)擊“下一步”按鈕;

“生成高級(jí)表達(dá)式”中,“輸入表達(dá)式”部分用“郵編”生成地區(qū)名,輸入“ZIPNAMEL(t1.zip)”,也點(diǎn)選函數(shù)和變量名進(jìn)行選擇,其中ZIPNAMEL函數(shù)返回對(duì)應(yīng)于其五位郵政編碼參數(shù)的州屬領(lǐng)地的名稱。這樣就把計(jì)算公式寫好了。然后點(diǎn)擊“下一步”按鈕;

 



“修改其他選項(xiàng)”中將標(biāo)識(shí)符和列名全部設(shè)為“state”,標(biāo)簽設(shè)為“地區(qū)”,點(diǎn)擊“下一步”按鈕;


 


 

點(diǎn)擊“完成”按鈕;

 

“計(jì)算列”對(duì)話框中,點(diǎn)擊“新建”按鈕;

“選擇類型”中點(diǎn)選“高級(jí)表達(dá)式”,點(diǎn)擊“下一步”按鈕;

“生成高級(jí)表達(dá)式”中用“郵編”生成城市名,輸入“ZIPCITY(t1.zip) ”,也點(diǎn)選函數(shù)和變量名進(jìn)行選擇,其中ZIPCITY函數(shù)返回城市名稱和對(duì)應(yīng)于郵政編碼的雙字符州代碼。點(diǎn)擊“下一步”按鈕;

“修改其他選項(xiàng)”中將標(biāo)識(shí)符和列名全部設(shè)為“city”,標(biāo)簽設(shè)為“城市”,點(diǎn)擊“下一步”按鈕;

點(diǎn)擊“完成”按鈕;

 

關(guān)閉“計(jì)算列”對(duì)話框; 

 

“查詢名稱”改為“計(jì)算地區(qū)和城市”,“輸出名稱改為mylib.bookconsumer1”。

 


點(diǎn)擊“選項(xiàng)”,將輸出數(shù)據(jù)的標(biāo)簽改為bookconsumer1

 


點(diǎn)擊“運(yùn)行”按鈕。

? 回到過程流窗口

 

雙擊bookconsumer1的圖標(biāo),可以查看該數(shù)據(jù)集里面的數(shù)據(jù)。

 

可以看到statecity兩個(gè)變量已經(jīng)生成。

將這個(gè)saseg文件保存為變量計(jì)算.egp

操作結(jié)果:

將上面整理的結(jié)果保存在文件夾中存為bookconsumer1.sas7dbat,以備后續(xù)使用。

知識(shí)點(diǎn)小結(jié):

如果想生成新的變量需要通過查詢生成器的方式來生成??梢詫?duì)查詢結(jié)果數(shù)據(jù)集的名稱進(jìn)行修改方便理解;在生成變量的過程中可以為新變量添加標(biāo)簽。


知識(shí)點(diǎn)3

知識(shí)點(diǎn)名稱:地區(qū)變量的頻數(shù)統(tǒng)計(jì)和總消費(fèi)量的分地區(qū)描述統(tǒng)計(jì)

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)分析

知識(shí)點(diǎn)背景:

對(duì)數(shù)據(jù)進(jìn)行建模之前通常對(duì)數(shù)據(jù)進(jìn)行一個(gè)基本描述,比如分類變量看下頻數(shù)分布。數(shù)值變量計(jì)算均值,標(biāo)準(zhǔn)差

知識(shí)點(diǎn)描述

對(duì)變量進(jìn)行描述性分析。

知識(shí)點(diǎn)關(guān)鍵詞:

頻數(shù)統(tǒng)計(jì)  描述統(tǒng)計(jì) 均值 標(biāo)準(zhǔn)差 中位數(shù) 最小值 最大值 分類匯總

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

對(duì)分類變量進(jìn)行頻數(shù)統(tǒng)計(jì);對(duì)數(shù)值變量進(jìn)行分類描述統(tǒng)計(jì)。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

Bookcustomer1.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer1.sas7bdat這個(gè)文件),單擊“下一步”按鈕;

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer1.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 

對(duì)一個(gè)分類變量進(jìn)行單因子頻數(shù)統(tǒng)計(jì)

在數(shù)據(jù)窗口下,執(zhí)行“描述”,“單因子頻數(shù)”命令。在“數(shù)據(jù)”項(xiàng)下,state拖至“任務(wù)角色”框中的“分析變量”下;

“統(tǒng)計(jì)量”項(xiàng)下,選擇“頻數(shù)和百分比”,勾選“缺失值”選項(xiàng)框“顯示頻數(shù)”和“包含在計(jì)算中”兩個(gè)選項(xiàng);

“結(jié)果”選項(xiàng)下,將“輸出數(shù)據(jù)的排序依據(jù)”選為“降序頻數(shù)”;

“結(jié)果”選項(xiàng)下,勾選“創(chuàng)建帶頻數(shù)和百分比的數(shù)據(jù)集”。將輸出的數(shù)據(jù)文件的名字存為MYLIB.ONEWAYFREQUENCYOFCITY。

 

點(diǎn)擊“運(yùn)行”按鈕。

? 回到過程流窗口,可以看到數(shù)據(jù)集和報(bào)表都生成了。

 


雙擊sas報(bào)表單因子頻數(shù)”,可以看到紐約的頻數(shù)是最多的。

 

一個(gè)數(shù)值變量total的分地區(qū)描述統(tǒng)計(jì)

? 回到過程流窗口,打開bookconsumer1數(shù)據(jù)集。

執(zhí)行“描述”,“匯總統(tǒng)計(jì)量”命令。

“數(shù)據(jù)”選項(xiàng)卡中,將total拉入分析變量,state拉入分類變量。

“統(tǒng)計(jì)量”-“基本”選項(xiàng)卡中,保持默認(rèn)勾選的基礎(chǔ)上,勾選“總和”。

“統(tǒng)計(jì)量”-“百分位數(shù)”選項(xiàng)卡中,勾選中位數(shù)。

點(diǎn)擊“運(yùn)行”

 

可以看到紐約的總消費(fèi)金額最大,同時(shí)紐約的單數(shù)也是最多的。最小值最大值看的話也沒有明顯的異常值問題。

操作結(jié)果:

通過前面的操作我們獲得了數(shù)據(jù)集ONEWAYFREQUENCYOFCITY.sas7dbat,以備后續(xù)使用。

知識(shí)點(diǎn)小結(jié):

如果想生成新的變量需要通過查詢生成器的方式來生成;可以對(duì)查詢結(jié)果數(shù)據(jù)集的名稱進(jìn)行修改方便理解;在生成變量的過程中可以為新變量添加標(biāo)簽;一般如果變量存在明顯異常值得話通過描述統(tǒng)計(jì)就可以看出。


知識(shí)點(diǎn)4

知識(shí)點(diǎn)名稱:消費(fèi)者各類圖書購買數(shù)量的相關(guān)性分析

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)分析

知識(shí)點(diǎn)背景:

對(duì)于可能存在關(guān)系的一些數(shù)值變量,通常需要查看其相關(guān)系數(shù)矩陣。

知識(shí)點(diǎn)描述

相關(guān)系數(shù)矩陣。

知識(shí)點(diǎn)關(guān)鍵詞:

相關(guān)系數(shù)

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

對(duì)變量進(jìn)行相關(guān)系數(shù)分析。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

Bookcustomer1.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer1.sas7bdat這個(gè)文件),單擊“下一步”按鈕;

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer1.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 

對(duì)一個(gè)分類變量進(jìn)行單因子頻數(shù)統(tǒng)計(jì)

在數(shù)據(jù)窗口下,執(zhí)行“分析”,“多元“,“相關(guān)分析”命令。在打開的相關(guān)分析窗口中,數(shù)據(jù)”項(xiàng)下,將A類”、“B”、“C”、“D”、“E”、“F”、“G”、“H拖至分析變量;

“選項(xiàng)”下勾選“Pearson”相關(guān)系數(shù);

? 在結(jié)果項(xiàng)下,選擇默認(rèn)設(shè)置;

點(diǎn)擊“運(yùn)行”按鈕

 

圖9.8  Pearson相關(guān)系數(shù)

根據(jù)統(tǒng)計(jì)學(xué)理論,相關(guān)系數(shù)絕對(duì)值,則認(rèn)為兩個(gè)變量顯著相關(guān);,則認(rèn)為兩個(gè)變量高度相關(guān);,對(duì)應(yīng)的兩變量中度相關(guān);,對(duì)應(yīng)的兩個(gè)變量低度相關(guān);,兩個(gè)變量關(guān)系極弱,不相關(guān)。

相關(guān)分析結(jié)果可以看出,消費(fèi)者購買A圖書和購買C圖書低度相關(guān)其他任何兩類圖書的購買幾乎不存在相關(guān)關(guān)系。因此圖書銷售時(shí),可以把AC一起銷售,或者推出A圖書和C圖書一起購買的優(yōu)惠活動(dòng)。

操作結(jié)果:

該知識(shí)點(diǎn)的操作沒有產(chǎn)生新的數(shù)據(jù)集,只有報(bào)表輸出。

知識(shí)點(diǎn)小結(jié):

相關(guān)系數(shù)大小的判別標(biāo)準(zhǔn)在不同行業(yè)中是不同的,這里計(jì)算的相關(guān)系數(shù)僅僅是兩兩相關(guān)系數(shù),不考慮其他變量。


知識(shí)點(diǎn)5

知識(shí)點(diǎn)名稱:RFM模型進(jìn)行客戶畫像

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)分析

知識(shí)點(diǎn)背景:

客戶畫像(UserProfile)即給用戶打上標(biāo)簽,用一種樸素、簡潔的方法來描述用戶信息。客戶畫像可以完美地抽象出一個(gè)用戶的信息全貌,為進(jìn)一步精準(zhǔn)、快速地分析用戶行為習(xí)慣、消費(fèi)習(xí)慣等重要商業(yè)信息,提供了足夠數(shù)據(jù)基礎(chǔ)。

RFM模型Bult and Wansbeek1995提出來的,認(rèn)為客戶行為三要素 Recency (R)、Frequency (F) Monetary (M)構(gòu)成了客戶購買潛力價(jià)值的核心組成部分。該模型經(jīng)常應(yīng)用于 CRM 框架下的客戶行為分析。

知識(shí)點(diǎn)描述

用聚類分析對(duì)客戶進(jìn)行畫像。

知識(shí)點(diǎn)關(guān)鍵詞:

聚類分析 FRM

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

對(duì)個(gè)案進(jìn)行聚類分析。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

Bookcustomer1.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕;

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer1.sas7bdat這個(gè)文件),單擊“下一步”按鈕

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer1.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 

在要分析的數(shù)據(jù)表下執(zhí)行“分析”,“多元”,“聚類分析”命令。在“數(shù)據(jù)”項(xiàng)下,將“距最后一次購買的月數(shù)”、“總夠買”、“總消費(fèi)”、“距首次購買的次數(shù)”拖至“任務(wù)角色”框中的“分析變量”下;

“聚類”項(xiàng)下,選擇“K均值算法”,最大聚類數(shù)填8;

“結(jié)果”項(xiàng)下,勾選“顯示輸出”和“K均值聚類”;將k均值聚類的結(jié)果數(shù)據(jù)集存為Local:mylib.CLKMKMeansDataBOOKCONSUMER1。

 

點(diǎn)擊“運(yùn)行”按鈕。

 

可以根據(jù)上述 “聚類均值”輸出結(jié)果表,參照RFM理論和實(shí)際業(yè)務(wù)情況進(jìn)行分類,找出有分析價(jià)值的一類幾類進(jìn)行更進(jìn)一步的分析。

操作結(jié)果:

將聚類結(jié)果保存為數(shù)據(jù)集CLKMKMeansDataBOOKCONSUMER1.sas7dbat,以備后續(xù)使用。

知識(shí)點(diǎn)小結(jié):

關(guān)于聚類過程中所設(shè)定的聚成幾類,一般需要根據(jù)業(yè)務(wù)經(jīng)驗(yàn)而定,不能聚類過多。


知識(shí)點(diǎn)6

知識(shí)點(diǎn)名稱:客戶總消費(fèi)的影響因素分析

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)分析

知識(shí)點(diǎn)背景:

我們希望了解影響消費(fèi)的因素有哪些,哪些因素顯著的,以便能夠提出相應(yīng)的對(duì)策提高消費(fèi)。

知識(shí)點(diǎn)描述

用回歸分析研究其他變量對(duì)總消費(fèi)金額的影響是否顯著。

知識(shí)點(diǎn)關(guān)鍵詞:

回歸分析

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

估計(jì)回歸模型。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

Bookcustomer1.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕;

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer1.sas7bdat這個(gè)文件),單擊“下一步”按鈕

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer1.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 

? 打開數(shù)據(jù)集,執(zhí)行“分析”,“回歸”,“線性回歸,彈出線性回歸”窗口。“數(shù)據(jù)”項(xiàng)下,“總消費(fèi)”拖至“因變量”,“距首次購買的月數(shù)”、“距最后一次購買的月數(shù)”、“A類”、“B”、“C”、“D”、“E”、“F”、“G”、“H”拖至“說明變量”;

 

“模型”項(xiàng)下,“模型選擇方法”選擇默認(rèn)的“全模型擬合”,其他項(xiàng)均選擇默認(rèn)設(shè)置;

點(diǎn)擊“運(yùn)行”按鈕。

 

由圖9.12可知,首次購買的數(shù)和距最后一次購買的月數(shù)這兩個(gè)變量0.05顯著水平下是不顯著的,因?yàn)槠?/span>P值大于0.05拒絕原假設(shè),認(rèn)為對(duì)因變量總消費(fèi)的影響是不顯著的。

操作結(jié)果:

該知識(shí)點(diǎn)的操作沒有產(chǎn)生新的數(shù)據(jù)集。

知識(shí)點(diǎn)小結(jié):

回歸分析中,解釋變量是否顯著,需要在給定顯著性水平的情況下才能確定。


知識(shí)點(diǎn)7

知識(shí)點(diǎn)名稱:書籍購買本數(shù)的分類求和 

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)分析

知識(shí)點(diǎn)背景:

我們想看各類書籍分別被賣了多少本,從而可以知道哪類書籍比較暢銷。

知識(shí)點(diǎn)描述

多變量求和。

知識(shí)點(diǎn)關(guān)鍵詞:

求和

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

多變量求和并畫圖。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

Bookcustomer1.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕;

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer1.sas7bdat這個(gè)文件),單擊“下一步”按鈕;

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer1.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 


打開數(shù)據(jù)表,點(diǎn)擊“查詢生成器”,A類”、“B”、“C”、“D”、“E”、“F”、“G”、“H”拖至“選擇數(shù)據(jù)”框中,將“A類”、“B”、“C”、“D”、“E”、“F”、“G”、“H”其后的匯總統(tǒng)計(jì)量選為SUM,匯總組為空,輸出名稱改為“mylib.sumofclass”。 

點(diǎn)開選項(xiàng)。把標(biāo)簽改為“各類書銷售本數(shù)”,點(diǎn)擊確定。


 

點(diǎn)擊“運(yùn)行”按鈕。

 

雙擊“各類書銷售本數(shù)”圖表。

 

在數(shù)據(jù)表中,執(zhí)行“數(shù)據(jù)”,”轉(zhuǎn)置”。彈出“轉(zhuǎn)置”窗口后,A類”、“B”、“C”、“D”、“E”、“F”、“G”、“H”拖至“轉(zhuǎn)置變量”下,點(diǎn)擊“運(yùn)行”按鈕。

 

點(diǎn)開“結(jié)果”選項(xiàng)卡。把輸出數(shù)據(jù)集的名稱改為MYLIB.sumofclass_1。

 

? 點(diǎn)擊運(yùn)行按鈕

 

? 在轉(zhuǎn)置所得的數(shù)據(jù)表中,雙擊數(shù)據(jù)單元格,數(shù)據(jù)切換至更新模式,選中“列1”右鍵單擊“屬性”,將名稱和標(biāo)簽改為“購買本數(shù)”;選中“源”,右鍵單擊“屬性”,將名稱和標(biāo)簽改為“書目大類”。

 


 

可以看到c類書目銷售最多,h類銷售最少。

在上面的數(shù)據(jù)窗口點(diǎn)擊“圖形”,“條形圖。在條形圖選項(xiàng)卡頁面,選擇“簡單垂直條形圖”;在“數(shù)據(jù)”選項(xiàng)卡頁面,將“書目大類”拉入要繪圖的列,把“購買本數(shù)”拉入“總和”,下圖所示。

 

點(diǎn)擊“運(yùn)行”

 

操作結(jié)果:

將過程中生成的數(shù)據(jù)集sumofclass.sas7dbat和sumofclass.sas7dbat_1進(jìn)行保存,以備后續(xù)使用。

知識(shí)點(diǎn)小結(jié):

在數(shù)據(jù)窗口可以對(duì)變量名字和標(biāo)簽進(jìn)行修改,也可以對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)置操作從而形成新的數(shù)據(jù)集。


知識(shí)點(diǎn)8

知識(shí)點(diǎn)名稱:是否購買h類書的Logistic回歸模型 

知識(shí)點(diǎn)所屬工作角色:

數(shù)據(jù)分析

知識(shí)點(diǎn)背景:

我們想研究哪些變量對(duì)是否購買h類書的決策產(chǎn)生影響。

知識(shí)點(diǎn)描述

如果被解釋變量只有0,1兩個(gè)取值,這樣的離散被解釋變量不再適合普通的回歸,需要采用logistic回歸進(jìn)行分析。

知識(shí)點(diǎn)關(guān)鍵詞:

logistic回歸分析   二元選擇模型  離散因變量模型 變量計(jì)算  啞變量生成

知識(shí)點(diǎn)所用軟件:

SasEG

操作目的:

構(gòu)建logistic回歸模型。

知識(shí)點(diǎn)素材(包括數(shù)據(jù)):

Bookcustomer1.sas7bdat

操作步驟:

啟動(dòng)sas eg

? ?新建項(xiàng)目邏輯庫。執(zhí)行“工具”—“分配項(xiàng)目邏輯庫”—輸入8個(gè)字符以內(nèi)的英文名稱(比如mylib),點(diǎn)擊“下一步”按鈕

? 在電腦中選擇一個(gè)文件夾,將其路徑作為邏輯庫的路徑(保證該路徑下面有bookcustomer1.sas7bdat這個(gè)文件),單擊“下一步”按鈕

點(diǎn)擊“下一步”按鈕,點(diǎn)擊“完成”按鈕,邏輯庫就建立成功了。

在左側(cè)的邏輯庫里面中找到mylib,然后把該邏輯庫下面的bookcustomer1.sas7bdat數(shù)據(jù)集拖入右側(cè)框里面。

? 切換到過程流窗口,可以看到數(shù)據(jù)已經(jīng)導(dǎo)入進(jìn)來了,雙擊數(shù)據(jù)圖標(biāo)就可以查看數(shù)據(jù)具體內(nèi)容。

 

在數(shù)據(jù)表bookconusmer1下打開“查詢生成器”,將輸出名稱改為MYLIB.BOOKCONSUMER2。

點(diǎn)開“選項(xiàng)”,在“結(jié)果”選項(xiàng)卡中將“標(biāo)簽”改為“BOOKCONSUMER2”。

? “選擇數(shù)據(jù)”部分選擇全部數(shù)據(jù),點(diǎn)擊左上角的“計(jì)算列”,打開計(jì)算列窗口,點(diǎn)擊“新建”新建“計(jì)算列”。在第一步選擇類型中點(diǎn)選“重新碼列”;

“選擇列”中選擇H類(classH),點(diǎn)擊“下一步”按鈕;

“指定替換”中“添加”替換。

選擇“替換條件”選項(xiàng)卡中,classH大于0使用值1,勾選“該值的兩側(cè)應(yīng)加等號(hào)”,點(diǎn)擊“確定”按鈕

 

按照同樣的方法添加classH等于0使用值0的條件。

? “列類型”設(shè)為“字符”,添加完成后,點(diǎn)擊“下一步”按鈕;

“修改其他選項(xiàng)”中將“標(biāo)識(shí)符和列名”全部設(shè)為H_as_Y“標(biāo)簽”設(shè)置為“是否購買H類書籍”,格式設(shè)置為$CHAR12,點(diǎn)擊“下一步”按鈕;

點(diǎn)擊“完成”按鈕;

? 關(guān)閉計(jì)算列窗口,點(diǎn)擊“運(yùn)行”按鈕

在上步生成的數(shù)據(jù)中,執(zhí)行“分析”,“回歸”,“Logistic回歸”。

“Logistic回歸”窗口中,“數(shù)據(jù)”選項(xiàng)卡下,將“是否購買H類書籍”拖至因變量,將“距首次購買的月數(shù)”、“距最后一次購買的月數(shù)”、“總購買”、“在圖書上的總消費(fèi)”、“在非書籍產(chǎn)品總消費(fèi)”拖至“數(shù)量變量”,將“性別”和“地區(qū)”拖至“分類變量”,“性別”和“地區(qū)”的“編碼樣式”選擇“引用”;

“模型”—“響應(yīng)”項(xiàng)下,“針對(duì)該水平擬合模型”選“1”,其他選默認(rèn);

“模型”—“效應(yīng)”項(xiàng)下,將全部變量設(shè)置為“主效應(yīng)”,勾選“包含截距”;其他項(xiàng)選擇默認(rèn)。

“圖形”選項(xiàng)卡下,取消“為回歸分析顯示圖形”的勾選。

點(diǎn)擊“運(yùn)行”按鈕。

 

這部分給出的是虛擬變量定義方式。

 

這部分給出的是HLogistic回歸最大似然估計(jì)值結(jié)果。結(jié)合上面兩個(gè)表格我們可以得出一些結(jié)論。在5%顯著性水平下,first變量對(duì)是否購買h類書籍無顯著影響。lastpurch變量對(duì)是否購買h類書籍有顯著正影響,即這兩個(gè)變量越大,購買h類書的可能性越大。booknonbook變量對(duì)是否購買h類書籍有顯著負(fù)影響,即這兩個(gè)變量越大,購買h類書的可能性越小。GenderF變量前面的系數(shù)顯著為正,說明男生和女生相比購買h類書的可能性要大。State中Connecticut、 Delaware、 District of Columbia、 Maine、 Maryland、 Massachusetts、 New Hampshire、 New Jersey、 New York、 Pennsylvania、 Rhode Island、 Vermont這幾個(gè)區(qū)或者州系數(shù)顯著為正,說明這幾個(gè)州和virginia州相比,要比virginia州的人購買h類書籍的可能性要大。

Virgin islands州前面的系數(shù)不顯著,說明這個(gè)州和virginia州相比對(duì)h類書籍購買的可能性沒有顯著區(qū)別。

操作結(jié)果:

將過程中生成的數(shù)據(jù)集bookconsumer2.sas7dbat進(jìn)行保存,以備后續(xù)使用。

知識(shí)點(diǎn)小結(jié):

無論是logistic回歸還是普通回歸,如果解釋變量中包含分類變量的話,需要先將其變?yōu)樘摂M變量再參與參數(shù)計(jì)算,注意虛擬變量前面系數(shù)的解釋。

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }