
SPSS中異常值檢驗(yàn)的幾種方法介紹(2)_數(shù)據(jù)分析師
ARIMA 模型:
描述時(shí)間序列數(shù)據(jù)的變化規(guī)律和行為,它允許模型中包含趨勢(shì)變動(dòng)、季節(jié)變動(dòng)、循環(huán)變 動(dòng)和隨機(jī)波動(dòng)等綜合因素影響。具有較高的預(yù)測(cè)精度,可以把握過去數(shù)據(jù)變動(dòng)模式,有助于 解釋預(yù)測(cè)變動(dòng)規(guī)律,回答為什么這樣本想早點(diǎn)完成這個(gè)時(shí)間序列的主題,但最近一直非常多的事情,又 耽擱了這么長(zhǎng)時(shí)間。朋友們問的問題沒有收尾總是不好,抓緊時(shí)間完成吧。 因?yàn)?,后天要參加中?guó)電信集團(tuán)的一個(gè) EDA 論壇,要仔細(xì)準(zhǔn)備發(fā)言稿!在交流的過程 中,發(fā)現(xiàn)大家都對(duì)預(yù)測(cè)問題非常關(guān)注,尤其是數(shù)據(jù)挖掘領(lǐng)域,有時(shí)候分類問題與預(yù)測(cè)問題在 表達(dá)上區(qū)分不開,有時(shí)候分類就是預(yù)測(cè),比如通過判別分析、C5.0 規(guī)則或 Logistics 回歸 進(jìn)行監(jiān)督類建模,得到的結(jié)論說該客戶是什么類別等級(jí),似乎也可以說是預(yù)測(cè);當(dāng)然,如果 能夠預(yù)測(cè)該消費(fèi)者什么時(shí)候流失,也就是進(jìn)行了分類;這樣說吧,其實(shí)有時(shí)候并不需要嚴(yán)格 區(qū)分分類和預(yù)測(cè),關(guān)鍵是時(shí)間點(diǎn)。從這也可以看出,預(yù)測(cè)問題內(nèi)涵和外延是非常寬泛的,但 研究者心中要有數(shù),這決定了你得到的結(jié)果該如何應(yīng)用。 前面的博文提到,如果我們考慮時(shí)間序列預(yù)測(cè)包含有預(yù)測(cè)和干擾變量如何解決的問題。 從方法角度講,過去沒有統(tǒng)計(jì)分析軟件要完成預(yù)測(cè)可以說是困難的,現(xiàn)在有了軟件工具 就方便多了。 從技術(shù)角度講:
預(yù)測(cè)模型如果能夠排除因?yàn)楫惓T蛟斐傻臅r(shí)間點(diǎn)事件和時(shí)間段時(shí)間,就好了。例 如某天停電沒有開業(yè),或者某一段時(shí)間比如發(fā)生甲型 H1NI 一周沒有營(yíng)業(yè)收入,這 些事件必須能夠告訴模型未來不會(huì)再發(fā)生了;當(dāng)然,我們也要把未來會(huì)重復(fù)發(fā)生的干擾因素納入模型,例如:我們學(xué)校某天要開 運(yùn)動(dòng)會(huì),小賣部的可樂銷量一定提高,或者我們學(xué)校 7-8 月份放暑假,銷量一定減 少,像這樣的時(shí)間點(diǎn)和時(shí)間段事件未來會(huì)重復(fù)出現(xiàn),我們?nèi)绻軌蚋嬖V模型,那么 預(yù)測(cè)會(huì)更準(zhǔn)確。
當(dāng)然如果我們建立的模型能夠預(yù)測(cè)未來,并能夠?qū)⑽磥砜深A(yù)見的事件,包括時(shí)間點(diǎn) 和時(shí)間段干擾納入預(yù)測(cè)是非常好的事情啦!
甚至,我們應(yīng)該能夠把預(yù)測(cè)模型中的,預(yù)測(cè)未來周期內(nèi)的不可預(yù)見的時(shí)間點(diǎn)和時(shí)間 段隨時(shí)干預(yù)預(yù)測(cè)結(jié)果,這就需要考慮如何將預(yù)測(cè)模型導(dǎo)入生產(chǎn)經(jīng)營(yíng)分析系統(tǒng)了。
下面的數(shù)據(jù)延續(xù)前兩篇的案例, 只是增加了自變量, (因?yàn)槭诸^這個(gè)案例沒有干預(yù)因素變量)
在我們?cè)黾恿?5 個(gè)自變量后,采用預(yù)測(cè)建模方法,選擇專家建模器,但限制只在 ARIMA 模 型中選擇。
確定后,得到分析結(jié)果,我們現(xiàn)在來看一下與原來的模型有什么不同。
從預(yù)測(cè)值看,比前一模型有了改進(jìn),至少這時(shí)候的模型捕捉了歷史數(shù)據(jù)中的下降峰值, 這可以認(rèn)為是當(dāng)前比較適合的擬合值了。 如果我們觀察預(yù)測(cè)結(jié)果,可以發(fā)現(xiàn)模型選擇了兩個(gè)預(yù)測(cè)變量。注意:使用專家建模器時(shí), 只有在自變量與因變量之間具有統(tǒng)計(jì)顯著性關(guān)系時(shí)才會(huì)包括自變量。如果選擇 ARIMA 模 型,“變量”選項(xiàng)卡上指定的所有自變量(預(yù)測(cè)變量)都包括在該模型中,這點(diǎn)與使用專家建 模器相反;
當(dāng)確定了最終選擇的預(yù)測(cè)模型和方法后,我們就可以預(yù)測(cè)未來了,當(dāng)然你要指定預(yù)測(cè)未 來的時(shí)間點(diǎn),這里我們時(shí)間包括年、季度和月份;假定我們預(yù)測(cè)未來半年的銷售收入。 我們分別設(shè)定:預(yù)測(cè)值輸出,95%置信度的上下限。注意:SPSS 中文環(huán)境有個(gè)小 Bug,
必須改一下名字!
在選項(xiàng)中,選擇你的預(yù)測(cè)時(shí)間,預(yù)測(cè)期將根據(jù)你事先定義的數(shù)據(jù)時(shí)間格式填寫。(后面 的模型為了讓大家看清楚,實(shí)際上我預(yù)測(cè)了一年的數(shù)據(jù),也就是 2010 年的 4 個(gè)季度的 12 個(gè)月)。
自變量的選擇問題,在預(yù)測(cè)未來半年的銷售收入中,ARIMA 模型可以把其它預(yù)測(cè)變量 納入考慮,但如何確定未來這些預(yù)測(cè)變量的值呢? 主要方法可以考慮:1)選擇最末期數(shù)據(jù);2)選擇近三期數(shù)據(jù)的平均;3)選擇近三期 的移動(dòng)平均 這里我們選近三期移動(dòng)平均作為預(yù)測(cè)自變量數(shù)值。
上面就是預(yù)測(cè)結(jié)果!于此同時(shí),SPSS 活動(dòng)數(shù)據(jù)集中也存儲(chǔ)了預(yù)測(cè)值!
最后,我們要解決時(shí)間序列預(yù)測(cè)的檢驗(yàn)和統(tǒng)計(jì)問題!說實(shí)在話,我比較關(guān)注偏好商業(yè)應(yīng)用,就是看得見就做得到!從上面的分析,我們基本上就知道了哪種預(yù)測(cè)模型更好,也就不去較真只有專業(yè)統(tǒng)計(jì)學(xué)者才關(guān)心的統(tǒng)計(jì)和檢驗(yàn)問題, 把這些交給統(tǒng)計(jì)專家或?qū)W術(shù)研究吧! 如 ( 果你是寫學(xué)術(shù)論文,就必須強(qiáng)調(diào)這一點(diǎn)了?。?實(shí)際上我們可以通過軟件得到各種統(tǒng)計(jì)檢驗(yàn)指標(biāo)和統(tǒng)計(jì)檢驗(yàn)圖表!
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03