在構(gòu)建回歸模型時(shí),如果自變量X為連續(xù)性變量,回歸系數(shù)β可以解釋為:在其他自變量不變的條件下,X每改變一個(gè)單位,所引起的因變量Y的平均變化量;如果自變量X為二分類(lèi)變量,例如是否飲酒(1=是,0=否),則回歸系數(shù)β可以解釋為:其他自變量不變的條件下,X=1(飲酒者)與X=0(不飲酒者)相比,所引起的因變量Y的平均變化量。 但是,當(dāng)自變量X為多分類(lèi)變量時(shí),例如職業(yè)、學(xué)歷、血型、疾病嚴(yán)重程度等等,此時(shí)僅用一個(gè)回歸系數(shù)來(lái)解釋多分類(lèi)變量之間的變化關(guān)系,及其對(duì)因變量的影響,就顯得太不理想。 此時(shí),我們通常會(huì)將原始的多分類(lèi)變量轉(zhuǎn)化為啞變量,每個(gè)啞變量只代表某兩個(gè)級(jí)別或若干個(gè)級(jí)別間的差異,通過(guò)構(gòu)建回歸模型,每一個(gè)啞變量都能得出一個(gè)估計(jì)的回歸系數(shù),從而使得回歸的結(jié)果更易于解釋?zhuān)哂袑?shí)際意義。 啞變量 啞變量(Dummy Variable),又稱(chēng)為虛擬變量、虛設(shè)變量或名義變量,從名稱(chēng)上看就知道,它是人為虛設(shè)的變量,通常取值為0或1,來(lái)反映某個(gè)變量的不同屬性。對(duì)于有n個(gè)分類(lèi)屬性的自變量,通常需要選取1個(gè)分類(lèi)作為參照,因此可以產(chǎn)生n-1個(gè)啞變量。 將啞變量引入回歸模型,雖然使模型變得較為復(fù)雜...








暫無(wú)數(shù)據(jù)