
SPSS分析技術:非線性回歸;非線性回歸與曲線直線化有哪些異同點及優(yōu)劣勢
本文介紹的非線性回歸就是針對以上更為復雜的問題而提出的一個通用的模型框架,它采用迭代方法對用戶設置的各種復雜曲線模型進行擬合,同時將殘差的定義從最小二乘法向外大大擴展(例如最小一乘法等方法)為用戶提供了極為強大的分析能力。
曲線直線化和非線性回歸
因變量和自變量是非線性關系時,可以通過曲線直線化和非線性回歸對它們之間的關系進行擬合。許多較為簡單的非線性模型可以通過變量變換轉化為線性模型,它們又被稱為可變換為線性的模型。可變換為線性的模型有許多優(yōu)點,諸如易于求得某些參數(shù)的初始值等。雖然曲線回歸簡單快捷、易于理解,但是曲線回歸(曲線直線化)的數(shù)據(jù)變換會導致隨機誤差項分布的變換,這將影響到最小二乘法所得解的含義以及模型的適用條件。例如假定變換前模型的誤差項服從正態(tài)分布,對于變換后的數(shù)據(jù)來說,其相應的誤差項很可能就不再服從正態(tài)分布。回歸分析的假設不僅只有正態(tài)性,也包括方差齊性、獨立性等要求,因此變換后的線性模型采用最小二乘法求得的最佳參數(shù)估計值并不一定是原模型的最佳估計。顯然,在較為復雜的非線性模型中,曲線直線化有其固有的問題,因此在精度要求較高,或者模型較復雜的非線性回歸問題中,采用曲線直線化來估計非線性方程并不是一個好的策略。
非線性回歸的基本原理可以從其回歸模型講起。非線性回歸模型一般可以表示為如下形式:
非線性回歸參數(shù)估計的基本思想非常類似于線性模型,分析者必須先給出一個能夠表示估計誤差的曲線函數(shù),然后使得該函數(shù)取值最小化,并求得此時的參數(shù)估計值。以常用的最小二乘法為例,它也是設法找到使得各數(shù)據(jù)點離模型回歸線縱向距離的平方和達到最小值,但此處的模型回歸線就是相應的曲線,而不是線性回歸中的直線,或者曲線擬合中變換后的直線。
由于曲線函數(shù)并非直線,使得模型無法直接計算出最小二乘估計的參數(shù)值,因此非線性回歸模型一般采用高斯-牛頓法進行曲線函數(shù)參數(shù)的估計。這種估計方法是對曲線函數(shù)作泰勒級數(shù)展開,以達到線性近似的目的,并反復迭代求解。首先為所有未知參數(shù)指定一個初始值,然后將原方程按泰勒級數(shù)展開,并只取一階各項作為線性函數(shù)的逼近,其余各項均歸入誤差,然后采用最小二乘法對該模型中的參數(shù)進行估計,用參數(shù)估計值替代初始值,得到一個新的曲線函數(shù);再將新得到的曲線函數(shù)展開,進行線性化,從而又可以求出一批參數(shù)估計值;如此反復,直至參數(shù)估計值收斂為止。這種參數(shù)估計方法的計算非常復雜,必須借助于計算機完成,在許多時候,初始值的設定對模型能否順利求解是有顯著影響的。非線性回歸模型在SPSS中可以采用未約束和定義參數(shù)約束兩個過程來擬和,前者用于一般的非線性模型,后者可用于帶約束條件的非線性模型的擬合,適用范圍更廣,算法也不相同。
案例分析
為了對比(曲線回歸)曲線直線化和非線性回歸這兩種回歸方式的不同。下面依然采用文章:SPSS分析技術:曲線直線化;一氧化碳中毒如何避免?的案例,在這篇文章中,通過對數(shù)據(jù)進行變換,原來通風時間和毒物濃度間的曲線關系被轉換成了直線,從而可以通過直接進行線性回歸得到分析結果。
分析步驟
選擇菜單【分析】-【回歸】-【非線性】,在跳出的對話框中進行如下設置。將一氧化碳濃度(毒物濃度)選入因變量;因為我們觀察因變量與自變量之間的關系服從指數(shù)函數(shù),所以在模型表達式中輸入指數(shù)函數(shù)公式y(tǒng)=a*exp(b*time)。因為指數(shù)函數(shù)有兩個待確定參數(shù),在右下角的輸入兩個參數(shù)的擬合初始值1。
結果解釋
1、迭代過程。由于迭代過程記錄太長,這里省略中間部分。觀察殘差平方和的變化,可見隨著迭代地進行,殘差平方和變得越來越小,也就是說模型無法解釋的變異部分越來越少。但這一過程不是無限進行下去的,當進行了15步迭代,共擬合了32個模型后,殘差平方和以及各參數(shù)的估計值均穩(wěn)定下來,模型達到收斂標準。
2、模型方差分析的結果。相應的原假設為所擬合的模型對因變量的預測無貢獻。由于這里進行的是非線性回歸,方差分析的F值和p值只有參考意義,因此結果中并不給出,可以手工計算。顯然,最終的p值遠小于0. 05,拒絕原假設,可以認為模型對于因變量的預測是有作用的。方框中的最下方計算出了模型的決定系數(shù)為0.989,第6章曲線直線化的p值等于0. 961,可見非線性回歸模型的擬合效果從決定系數(shù)來看是更好,可惜曲線直線化的決定系數(shù)與非線性回歸的決定系數(shù)是不可比的(后面會介紹原因)。
3、回歸系數(shù)估計值;
4、兩種方法比較。
上面用非線性回歸的方法得到了模型表達式的估計值。顯然,該表達式和曲線直線化所得到的結果并不相同,a和b兩個系數(shù)的值相差不小。究竟哪一個方程更好呢?雖然從決定系數(shù)上看似乎是非線性回歸的方程更優(yōu),但是曲線擬合中計算出的決定系數(shù)實際上是曲線直線化后直線方程的決定系數(shù),并不一定代表變換前的變異解釋程度,即兩個模型的決定系數(shù)是不可比的。
為了能直觀地對兩個模型進行比較,這里分別對本案例的數(shù)據(jù)分別擬合兩個模型,并利用【保存】子對話框求得各自的模型預測值與預測殘差,并繪制圖形如下圖所示。下圖是原始數(shù)據(jù)、曲線回歸模型、非線性回歸模型三者的比較,從中可見在通風時間大于4 分鐘時,兩個模型的預測效果基本接近,似乎是非線性回歸模型更好一些。但是在小于4 分鐘時,則曲線擬和模型的預測效果明顯較差。特別是第1和第2分鐘的數(shù)據(jù),顯然預測誤差較大。綜合比較之下,非線性回歸模型的擬合效果要更好。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03