
時(shí)間序列預(yù)測(cè)方法
預(yù)測(cè):是對(duì)尚未發(fā)生或目前還不明確的事物進(jìn)行預(yù)先的估計(jì)和推測(cè),是在現(xiàn)時(shí)對(duì)事物將要發(fā)生的結(jié)果進(jìn)行探討和研究,簡(jiǎn)單地說(shuō)就是指從已知事件測(cè)定未知事件。
為什么要預(yù)測(cè)呢,因?yàn)轭A(yù)測(cè)可以幫助了解事物發(fā)展的未來(lái)狀況后,人們可以在目前為它的到來(lái)做好準(zhǔn)備,通過(guò)預(yù)測(cè)可以了解目前的決策所可能帶來(lái)的后果,并通過(guò)對(duì)后果的分析來(lái)確定目前的決策,力爭(zhēng)使目前的決策獲得最佳的未來(lái)結(jié)果。
我們進(jìn)行預(yù)測(cè)的總的原則是:認(rèn)識(shí)事物的發(fā)展變化規(guī)律,利用規(guī)律的必然性,是進(jìn)行科學(xué)預(yù)測(cè)所應(yīng)遵循的總的原則。
這個(gè)總原則實(shí)際上就是事物發(fā)展的
1-“慣性”原則——事物變化發(fā)展的延續(xù)性;
2-“類(lèi)推”原則——事物發(fā)展的類(lèi)似性;
3-“相關(guān)”原則——事物的變化發(fā)展是相互聯(lián)系的;
4-“概率”原則——事物發(fā)展的推斷預(yù)測(cè)結(jié)果能以較大概率出現(xiàn),則結(jié)果成立、可用;
時(shí)間序列預(yù)測(cè)主要包括三種基本方法:
1-內(nèi)生時(shí)間序列預(yù)測(cè)技術(shù);2-外生時(shí)間序列預(yù)測(cè)技術(shù);3-主觀時(shí)間序列預(yù)測(cè)技術(shù);
當(dāng)然今天我們主要討論內(nèi)生時(shí)間序列預(yù)測(cè)技術(shù)——也就是只關(guān)注時(shí)間序列的下的預(yù)測(cè)問(wèn)題!
時(shí)間序列主要考慮的因素是:
長(zhǎng)期趨勢(shì)(Long-term trend)
指數(shù)平滑方法(Exponential smoothing models):
描述時(shí)間序列數(shù)據(jù)的變化規(guī)律和行為,不去試圖解釋和理解這種變化的原因。例如:您可能發(fā)現(xiàn)在過(guò)去的一年里,三月和九月都會(huì)出現(xiàn)銷(xiāo)售的高峰,您可能希望繼續(xù)保持這樣,盡管您不知道為什么。
ARIMA模型:
描述時(shí)間序列數(shù)據(jù)的變化規(guī)律和行為,它允許模型中包含趨勢(shì)變動(dòng)、季節(jié)變動(dòng)、循環(huán)變動(dòng)和隨機(jī)波動(dòng)等綜合因素影響。具有較高的預(yù)測(cè)精度,可以把握過(guò)去數(shù)據(jù)變動(dòng)模式,有助于解釋預(yù)測(cè)變動(dòng)規(guī)律,回答為什么這樣。
下面看看如何采用SPSS軟件進(jìn)行時(shí)間序列的預(yù)測(cè)!
這里我用PASW Statistics 18軟件,大家可能覺(jué)得沒(méi)見(jiàn)過(guò)這個(gè)軟件,其實(shí)就是SPSS18.0,不過(guò)現(xiàn)在SPSS已經(jīng)把產(chǎn)品名稱(chēng)改稱(chēng)為PASW了!
博易智訊的馬博士剛剛把這個(gè)產(chǎn)品測(cè)試版給我,還是中文版,先睹為快吧!
我們通過(guò)案例來(lái)說(shuō)明:(本案例并不想細(xì)致解釋預(yù)測(cè)模型的預(yù)測(cè)的假設(shè)檢驗(yàn)問(wèn)題,1-太復(fù)雜、2-相信軟件)
假設(shè)我們拿到一個(gè)時(shí)間序列數(shù)據(jù)集:某男裝生產(chǎn)線銷(xiāo)售額。一個(gè)產(chǎn)品分類(lèi)銷(xiāo)售公司會(huì)根據(jù)過(guò)去 10 年的銷(xiāo)售數(shù)據(jù)來(lái)預(yù)測(cè)其男裝生產(chǎn)線的月銷(xiāo)售情況。
現(xiàn)在我們得到了10年120個(gè)歷史銷(xiāo)售數(shù)據(jù),理論上講,歷史數(shù)據(jù)越多預(yù)測(cè)越穩(wěn)定,一般也要24個(gè)歷史數(shù)據(jù)才行!
大家看到,原則上講數(shù)據(jù)中沒(méi)有時(shí)間變量,實(shí)際上也不需要時(shí)間變量,但你必須知道時(shí)間的起點(diǎn)和時(shí)間間隔。
當(dāng)我們現(xiàn)在預(yù)測(cè)方法創(chuàng)建模型時(shí),記住:一定要先定義數(shù)據(jù)的時(shí)間序列和標(biāo)記!
這時(shí)候你要決定你的時(shí)間序列數(shù)據(jù)的開(kāi)始時(shí)間,時(shí)間間隔,周期!在我們這個(gè)案例中,你要決定季度是否是你考 慮周期性或季節(jié)性的影響因素,軟件能夠偵測(cè)到你的數(shù)據(jù)的季節(jié)性變化因子。
定義了時(shí)間序列的時(shí)間標(biāo)記后,數(shù)據(jù)集自動(dòng)生成四個(gè)新的變量:YEAR、QUARTER、MONTH和DATE(時(shí)間標(biāo)簽)。
接下來(lái):為了幫我們找到適當(dāng)?shù)哪P停詈孟壤L制時(shí)間序列。時(shí)間序列的可視化檢查通??梢院芎玫刂笇?dǎo)并幫助我們進(jìn)行選擇。另外,我們需要弄清以下幾點(diǎn):
? 此序列是否存在整體趨勢(shì)?如果是,趨勢(shì)是顯示持續(xù)存在還是顯示將隨時(shí)間而消逝?
? 此序列是否顯示季節(jié)變化?如果是,那么這種季節(jié)的波動(dòng)是隨時(shí)間而加劇還是持續(xù)穩(wěn)定存在?
這時(shí)候我們就可以看到時(shí)間序列圖了!
我們看到:此序列顯示整體上升趨勢(shì),即序列值隨時(shí)間而增加。上升趨勢(shì)似乎將持續(xù),即為線性趨勢(shì)。此序列還有一個(gè)明顯的季節(jié)特征,即年度高點(diǎn)在十二月。季節(jié)變化顯示隨上升序列而增長(zhǎng)的趨勢(shì),表明是乘法季節(jié)模型而不是加法季節(jié)模型。
此時(shí),我們對(duì)時(shí)間序列的特征有了大致的了解,便可以開(kāi)始嘗試構(gòu)建預(yù)測(cè)模型。時(shí)間序列預(yù)測(cè)模型的建立是一個(gè)不斷嘗試和選擇的過(guò)程。
PASW Statistics提供了三大類(lèi)預(yù)測(cè)方法:1-專(zhuān)家建模器,2-指數(shù)平滑法,3-ARIMA
指數(shù)平滑法
指數(shù)平滑法有助于預(yù)測(cè)存在趨勢(shì)和/或季節(jié)的序列,此處數(shù)據(jù)同時(shí)體現(xiàn)上述兩種特征。創(chuàng)建最適當(dāng)?shù)闹笖?shù)平滑模型包括確定模型類(lèi)型(此模型是否需要包含趨勢(shì)和/或季節(jié)),然后獲取最適合選定模型的參數(shù)。
1-簡(jiǎn)單模型預(yù)測(cè)(即無(wú)趨勢(shì)也無(wú)季節(jié))
首先我們采用最為簡(jiǎn)單的建模方法,就是簡(jiǎn)單模型,這里我們不斷嘗試的目的是讓大家熟悉各種預(yù)測(cè)模型,了解模型在什么時(shí)候不適合數(shù)據(jù),這是成功構(gòu)建模型的基本技巧。我們先不討論模型的檢驗(yàn),只是直觀的看一下預(yù)測(cè)模型的擬合情況,最后我們確定了預(yù)測(cè)模型后我們?cè)儆懻摍z驗(yàn)和預(yù)測(cè)值。
從圖中我們看到,雖然簡(jiǎn)單模型確實(shí)顯示了漸進(jìn)的上升趨勢(shì),但并不是我們期望的結(jié)果,既沒(méi)有考慮季節(jié)性變化,也沒(méi)有周期性呈現(xiàn),直觀的講基本上與線性預(yù)測(cè)沒(méi)有差異。所以我們拒絕此模型。
2-Holt線性趨勢(shì)預(yù)測(cè)
Holt線性指數(shù)平滑法,一般選擇:針對(duì)等級(jí)的平滑系數(shù)lapha=0.1,針對(duì)趨勢(shì)的平滑系數(shù)gamma=0.2;
從上面的擬合情況看,Holt預(yù)測(cè)模型更平滑了,也就是說(shuō)Holt模型比簡(jiǎn)單模型顯現(xiàn)了更強(qiáng)的平滑趨勢(shì),但未考慮季節(jié)因素,還是不理想,所以還應(yīng)放棄此模型。
3-簡(jiǎn)單季節(jié)性模型
當(dāng)我們考慮了季節(jié)性變化后,簡(jiǎn)單季節(jié)性預(yù)測(cè)模型基本上較好的擬合了數(shù)據(jù)的大趨勢(shì),也就是考慮了趨勢(shì)和季節(jié)。
4-Winters相乘法預(yù)測(cè)模型
我們?cè)俅芜x擇Winters預(yù)測(cè)模型,實(shí)際上這時(shí)候非統(tǒng)計(jì)專(zhuān)業(yè)人士其實(shí)已經(jīng)可以不用考慮Winters模型的原理了,因?yàn)閷?duì)于大部分經(jīng)營(yíng)分析人員,如果期望把每一個(gè)預(yù)測(cè)方式的細(xì)節(jié)都搞清楚,并不容易,也容易陷入數(shù)量層面的糾葛中,我們只要相信軟件算法就可以了。
此時(shí),在數(shù)據(jù)集的時(shí)間跨度為10年,并且包含 10 個(gè)季節(jié)峰值(出現(xiàn)在每年十二月份)中,簡(jiǎn)單季節(jié)模型和Winters模型都撲捉到了這10個(gè)峰值與實(shí)際數(shù)據(jù)中的10個(gè)年度峰值完全匹配的預(yù)測(cè)結(jié)果。此時(shí),我們基本上可以得到了一個(gè)比較滿意的預(yù)測(cè)結(jié)果。
此時(shí)也說(shuō)明,無(wú)論采用指數(shù)平滑的什么模型,只要考慮了季節(jié)因素,都可以得到較好結(jié)果,不同的季節(jié)性指數(shù)平滑方法只是細(xì)微差異了。
但是,我們仔細(xì)看預(yù)測(cè)值和擬合值,還是有一些上升和下降的趨勢(shì)和結(jié)構(gòu)沒(méi)有撲捉到。預(yù)測(cè)還有改進(jìn)的需求!
5-ARIMA預(yù)測(cè)模型
ARIMA模型是自回歸AR和移動(dòng)平均MA加上差分考慮,但ARIMA模型就比較復(fù)雜了,對(duì)大部分經(jīng)營(yíng)分析人員來(lái)講,要搞清楚原理和方程公式,太困難了!期望搞清楚的人必須學(xué)過(guò)隨機(jī)過(guò)程,什么平穩(wěn)過(guò)程、白噪聲等,大部分人頭都大了,現(xiàn)在有了軟件就不問(wèn)為什么了,只要知道什么數(shù)據(jù)In,什么結(jié)果Out,就可以了。
我們采用專(zhuān)家建模器,但指定僅限ARIMA模型,并考慮季節(jié)性因素。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10