
101003
財(cái)務(wù)管理領(lǐng)域的應(yīng)用——上市公司財(cái)務(wù)指標(biāo)綜合分析
劉莎莎
69 證券
SPSS
因子分析 度量尺度變量轉(zhuǎn)化為有序尺度變量、對(duì)應(yīng)分析回歸分析 OLS VIF 方差膨脹因子 多重共線性個(gè)案選擇 logistic回歸分析 二元選擇模型 離散因變量模型 逐步回歸 多重貢獻(xiàn)性 樣本外預(yù)測 樣本內(nèi)預(yù)測 模型預(yù)測 隨機(jī)選擇樣本 過濾變量的生成
財(cái)務(wù)管理是指在一定的整體目標(biāo)下,關(guān)于資產(chǎn)的購置(投資),資本的融通(籌資)和經(jīng)營中現(xiàn)金流量(營運(yùn)資金),以及利潤分配的管理。財(cái)務(wù)管理是現(xiàn)代企業(yè)管理的重要組成部分,它是根據(jù)財(cái)經(jīng)法規(guī)制度,按照財(cái)務(wù)管理的原則,組織安排企業(yè)財(cái)務(wù)活動(dòng),處理財(cái)務(wù)關(guān)系的一項(xiàng)經(jīng)濟(jì)管理工作。
在財(cái)務(wù)管理領(lǐng)域的專業(yè)高效數(shù)據(jù)分析可以使企業(yè)經(jīng)營決策者充分地利用企業(yè)財(cái)務(wù)資源,了解企業(yè)經(jīng)營現(xiàn)狀,獲得進(jìn)一步做出正確的經(jīng)營決策的依據(jù), 進(jìn)而加強(qiáng)企業(yè)成本控制、改善財(cái)務(wù)狀況、提高企業(yè)經(jīng)營效益以增強(qiáng)企業(yè)市場競爭力。
本案例的數(shù)據(jù)文件說明:數(shù)據(jù)文件名字為caiwu.sav。該數(shù)據(jù)為2014年49家公司的年報(bào)財(cái)務(wù)指標(biāo)。變量包括st狀態(tài)、股票代碼,公司簡稱、公司全稱、包括資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、產(chǎn)權(quán)比率、加權(quán)凈資產(chǎn)收益率、攤薄總資產(chǎn)報(bào)酬率、毛利率、凈利率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)、營業(yè)收入增長率、總資產(chǎn)增長率、資本積累率、觀測值編號(hào)。
選取的49家公司里面既有st公司又有非st公司,這樣選取的目的是為了能夠使得數(shù)據(jù)適合建立logistic回歸模型,進(jìn)而起到預(yù)測的目的。本案例的分析目的是用現(xiàn)在擁有的一些上市公司財(cái)務(wù)指標(biāo)數(shù)據(jù)起到探索指標(biāo)間的關(guān)系及預(yù)測的目的。
本案例共包含四個(gè)知識(shí)點(diǎn):
第1個(gè)知識(shí)點(diǎn)用因子分析對(duì)14個(gè)財(cái)務(wù)指標(biāo)進(jìn)行降維,將14個(gè)財(cái)務(wù)指標(biāo)降為4個(gè)因子(盈利能力、發(fā)展能力、資本結(jié)構(gòu)、資本周轉(zhuǎn)),計(jì)算各個(gè)因子的得分形成四個(gè)新的變量。
第2個(gè)知識(shí)點(diǎn)用第一個(gè)知識(shí)點(diǎn)中得到的盈利能力、發(fā)展能力兩個(gè)因子進(jìn)行對(duì)應(yīng)分析。通過對(duì)應(yīng)分析發(fā)現(xiàn),盈利能力高的公司,可能發(fā)展能力只是中上水平。盈利能力中上的企業(yè),發(fā)展能力可能比較差。盈利能力中下的企業(yè)可能發(fā)展能力更強(qiáng)。盈利能力差的發(fā)展能力也較差。
第3個(gè)知識(shí)點(diǎn)用線性回歸分析方法研究其他財(cái)務(wù)指標(biāo)對(duì)凈利率的影響。首先把“資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、產(chǎn)權(quán)比率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)”幾個(gè)變量全部作為解釋變量加入到回歸方程里面,接著根據(jù)變量的顯著性和方差膨脹因子判定多重共線性問題,然后去掉可能引起共線性的變量,最終得到一個(gè)比較簡潔的方程。發(fā)現(xiàn)資產(chǎn)負(fù)債率和存貨周轉(zhuǎn)天數(shù)對(duì)凈利率影響為正,產(chǎn)權(quán)比率和應(yīng)收賬款周轉(zhuǎn)天數(shù)對(duì)凈利率影響為正。
第4個(gè)知識(shí)點(diǎn)從49個(gè)公司樣本中,用隨機(jī)抽樣,抽取80%的公司樣本(45個(gè)公司)作為建模樣本,用logistic回歸方法進(jìn)行模型估計(jì),研究各財(cái)務(wù)指標(biāo)對(duì)公司st狀態(tài)的影響,進(jìn)而對(duì)參與建模的45個(gè)公司和未參與模型估計(jì)的4個(gè)公司的st狀態(tài)均作出預(yù)測(對(duì)45個(gè)公司的預(yù)測稱為樣本內(nèi)預(yù)測,對(duì)4個(gè)公司的預(yù)測稱為樣本外預(yù)測)。然后對(duì)兩類樣本的預(yù)測效果作出評(píng)價(jià)。樣本內(nèi)預(yù)測的準(zhǔn)確率為88.9%,樣本外預(yù)測的準(zhǔn)確率為75%。
單人上機(jī)
數(shù)據(jù)分析
因子分析是一種從大量數(shù)據(jù)中由表及里、去粗取精尋找隱性解釋變量的統(tǒng)計(jì)分析技術(shù)。
我們可以使用因子分析來對(duì)多個(gè)相關(guān)性比較強(qiáng)的指標(biāo)進(jìn)行數(shù)據(jù)降維、分析挖掘潛在變量。
因子分析
Spss
對(duì)數(shù)據(jù)進(jìn)行降維分析,將多個(gè)相關(guān)性比較強(qiáng)的指標(biāo)濃縮為比較少的幾個(gè)指標(biāo)。
caiwu.sav
? 執(zhí)行“分析”,“降維”,“因子分析”命令,彈出“因子分析”對(duì)話框;
? 將資產(chǎn)負(fù)債率變量到資本積累率變量拉入“變量”選擇框里,點(diǎn)擊“抽取”選項(xiàng),保持默認(rèn)設(shè)置,即公因子提取方法為主成分法。按照特征值大于1的原則來提取主因子個(gè)數(shù),點(diǎn)擊“繼續(xù)”按鈕;點(diǎn)擊“旋轉(zhuǎn)”選項(xiàng),是對(duì)主因子進(jìn)行旋轉(zhuǎn),目的是公因子的含義更加明確。選擇“最大方差法”,勾選“載荷圖”,點(diǎn)擊“繼續(xù)”按鈕;
? 點(diǎn)擊“得分”選項(xiàng)卡,勾選“保存為變量”,方法選擇“回歸”,勾選“顯示因子得分系數(shù)矩陣”,可以看到因子的得分系數(shù)。也可以不看,我們這里不勾選,點(diǎn)擊“繼續(xù)”按鈕;
? 點(diǎn)擊“確定”按鈕。
圖4 總方差解釋圖
可以看到按照特征根大于1的原則來提取主因子,共提取了4個(gè)因子,但是在因子分析的過程中,提取的主因子的累計(jì)貢獻(xiàn)率一般需要達(dá)到85%,但是在分析不同的問題時(shí)可以按照分析目的稍微調(diào)整,能夠達(dá)到分析目的的要求即可。若是要求必須在85%以上,則在SPSS操作中可通過自行設(shè)置主因子的個(gè)數(shù),使其累計(jì)貢獻(xiàn)率達(dá)到85%。這里我們僅按照特征值大于1的規(guī)則提取四個(gè)因子。
圖5 成分矩陣
圖5輸出結(jié)果是因子載荷矩陣,表示四個(gè)因子在各個(gè)變量上的載荷。數(shù)值絕對(duì)值越大說明這個(gè)因子負(fù)載的某個(gè)變量的信息越多。
圖6 旋轉(zhuǎn)后的成分矩陣
上述輸出結(jié)果是旋轉(zhuǎn)之后的各個(gè)變量與四個(gè)主因子之間的關(guān)系,前面已經(jīng)提到,進(jìn)行旋轉(zhuǎn)的目的是為了是各個(gè)因子的系數(shù)盡量接近于0或者是1,以期能夠得到含義更加明確的因子的意義。
圖7 因子得分系數(shù)矩陣
上表為因子得分系數(shù)矩陣,是用來計(jì)算各因子的得分的,因?yàn)?span>更多的時(shí)候我們需要將公因子表達(dá)為各變量的線形形式。主因子1就可表示為:F1= -0.271*流動(dòng)負(fù)債率-0.094*流動(dòng)比率-0.1*速動(dòng)比率-0.382*產(chǎn)權(quán)比率+0.284*加權(quán)凈資產(chǎn)收益率+0.075*攤薄總資產(chǎn)報(bào)酬率+0.038*毛利率+0.171*凈利率+0.081*總資產(chǎn)周轉(zhuǎn)率+0.054*應(yīng)收賬款周轉(zhuǎn)天數(shù)+0.156*存貨周轉(zhuǎn)天數(shù)-0.191*營業(yè)收入增長率-0.196*總資產(chǎn)增長率+0.134*資本累積率
SPSS中勾選了“保存為為變量”這一選項(xiàng),在原始的數(shù)據(jù)中,四個(gè)因子的名字自動(dòng)存為FAC1_1、FAC2_1、FAC3_1、FAC4_1, 第一個(gè)因子可以定義為盈利能力因子,第二個(gè)公因子主要反映了公司未來增長和發(fā)展趨勢的,因此可以定義為發(fā)展能力因子,第三個(gè)因子為公司資本結(jié)構(gòu)因子,第四個(gè)因子定義為資本周轉(zhuǎn)因子。
將上面生成的因子得分變量保存在文件夾中存為caiwu1.xlsx,以備后續(xù)使用。
因子分析的目的主要是為了降維,把比較多的變量變成比較少的變量,如果變量之間的相關(guān)性比較強(qiáng)才適合進(jìn)行因子分析。通過觀察第一因子得分發(fā)現(xiàn)南寧化工股份有限公司、云南景谷林業(yè)股份有限公司、上海超日太陽能科技股份有限公司這三家公司的得分負(fù)值比較大,確實(shí)這幾家公司的盈利能力比較差。
數(shù)據(jù)分析
如果想要對(duì)兩個(gè)分類變量或者是兩個(gè)定序尺度變量的相關(guān)性進(jìn)行分析則可以采用對(duì)應(yīng)分析。
對(duì)應(yīng)分析是研究兩個(gè)分類變量之間的關(guān)系,主要是采用圖形化展示結(jié)果。
度量尺度變量轉(zhuǎn)化為有序尺度變量、對(duì)應(yīng)分析
SPSS
對(duì)兩個(gè)定序尺度變量進(jìn)行對(duì)應(yīng)分析。
Caiwu1.sav
數(shù)據(jù)中的FAC1_1、FAC2_1、FAC3_1、FAC4_1四個(gè)變量,分別為為盈利能力因子、發(fā)展能力因子、公司資本結(jié)構(gòu)因子、資本周轉(zhuǎn)因子。
操作步驟:
? 打開caiwu1.sav
? 將度量尺度變量轉(zhuǎn)化為名義尺度變量。
我們根據(jù)因子分析部分提取的公因子FAC1_1,對(duì)個(gè)案進(jìn)行分類,共分成4類,F(xiàn)AC1_1<-0.5為類別1,-0.5
我們根據(jù)因子分析部分提取的公因子FAC2_1,對(duì)個(gè)案進(jìn)行分類,共分成4類,F(xiàn)AC1_1<-0.5為類別1,-0.5
? 執(zhí)行“轉(zhuǎn)換”,“重新編碼為不同的變量”命令;
? 將FAC1_1選入右側(cè)框中,將輸出變量的名稱框里寫上盈利能力。然后點(diǎn)擊“更改”
? 點(diǎn)擊“舊值和新值”按照FAC1_1<-0.5為類別1,-0.5
? 點(diǎn)擊繼續(xù)
? 將FAC1_1選入右側(cè)框中,將輸出變量的名稱框里寫上盈利能力。然后點(diǎn)擊“更改”
?
? 點(diǎn)擊“舊值和新值”按照FAC2_1<-0.5為類別1,-0.5
? 點(diǎn)擊“繼續(xù)”
? 點(diǎn)擊“確定”
? 可以看到盈利能力和發(fā)展能力兩個(gè)變量生成成功。
? 執(zhí)行“分析”,“降維”,“對(duì)應(yīng)分析”命令;
? 將盈利能力變量選入“行”框里,發(fā)展能力選入“列”框里。
圖10 對(duì)應(yīng)分析
? 點(diǎn)開“行”下面的“定義范圍”,最小值設(shè)定為1,最大值設(shè)為4,點(diǎn)擊“更新”按鈕;
? 點(diǎn)擊“繼續(xù)”按鈕;
? 點(diǎn)擊“列”下面的“定義范圍”,最小值設(shè)定為1,最大值設(shè)為4,點(diǎn)擊“更新”按鈕;
? 點(diǎn)擊“繼續(xù)”按鈕;
點(diǎn)擊“statistics”選項(xiàng),勾選“行點(diǎn)概覽”及“列點(diǎn)概覽”選項(xiàng),其他默認(rèn),點(diǎn)擊“繼續(xù)”按鈕,然后點(diǎn)擊“確定”,輸出結(jié)果如下:
圖11 對(duì)應(yīng)表
上述輸出的是對(duì)應(yīng)表,即兩變量的行*列表。對(duì)應(yīng)分析后續(xù)的計(jì)算就是基于這個(gè)表格進(jìn)行的。
圖14摘要
上述輸出的是對(duì)應(yīng)分析的結(jié)果匯總表,給出所提取的每個(gè)維度所攜帶的信息量,從而幫助確定需要使用多少個(gè)維度對(duì)結(jié)果進(jìn)行解釋。從左到右的前6個(gè)指標(biāo)依次是維數(shù)、奇異值、慣量、總的卡方檢驗(yàn)及P值、方差解釋比例。
奇異值的平方就等于慣量,相當(dāng)于因子分析中常說的特征根,用于說明對(duì)應(yīng)分析各個(gè)維度的結(jié)果能夠解釋列表中兩變量聯(lián)系的程度。所有維度慣量的總和可以用來表示總信息量的大小。
卡方檢驗(yàn)及P值用來檢驗(yàn)行變量與列變量指甲是否存在關(guān)聯(lián),被看作是對(duì)應(yīng)分析適用條件的檢驗(yàn),只有放行變量與列變量有關(guān)聯(lián)時(shí),才需要使用對(duì)應(yīng)分析進(jìn)行詳細(xì)分析。這里我們的卡方統(tǒng)計(jì)量對(duì)應(yīng)的相伴概率為0.19,說明兩個(gè)變量的相關(guān)性不是很強(qiáng),不是特別適合進(jìn)行對(duì)應(yīng)分析。
圖 行點(diǎn)總覽結(jié)果圖
上述輸出結(jié)果為行變量盈利能力的各類別的分析結(jié)果概況。上述輸出結(jié)果為行變量(盈利能力)各類別的分析結(jié)果概況,主要給出了各類別在各維度上的評(píng)分,以及相應(yīng)的信息貢獻(xiàn)量兩大類信息。Mass(質(zhì)量)是指行變量各類別的構(gòu)成比,例如類別1占總數(shù)的比為16.3%;Score in Dimension(維中的得分)給出行變量各類別在相關(guān)維度上的評(píng)分,也就是行變量各狀態(tài)在二維圖中的坐標(biāo)值;Inertia(慣量)反映的是總慣量中分別由各行變量類別所提供的部分,數(shù)值越大,說明該類別對(duì)總慣量的貢獻(xiàn)越大;Contribution(貢獻(xiàn))分為點(diǎn)對(duì)維數(shù)的慣量和維數(shù)對(duì)點(diǎn)的慣量。點(diǎn)對(duì)維數(shù)的慣量說的是行變量各類別對(duì)每一個(gè)維度特征值的貢獻(xiàn)。維數(shù)對(duì)點(diǎn)的慣量說的是每一個(gè)維度對(duì)行變量各類別特征值的貢獻(xiàn)。由此可以更好的理解維度的來源及意義。
比如從點(diǎn)對(duì)維數(shù)的慣量部分,我們看到第一維度的信息主要被2類別和4類別攜帶,即這兩個(gè)類別在第一維度上的區(qū)分度較好。我們看到第二維度的信息主要被1類別和3類別攜帶,即這兩個(gè)類別在第二維度上的區(qū)分度較好。
比如從維數(shù)對(duì)點(diǎn)的慣量部分,我們看到第一維度對(duì)3 4兩個(gè)類別貢獻(xiàn)比較大(或者說第3 4兩個(gè)類別的大部分信息由第一維度解釋),第二維度對(duì)2類別貢獻(xiàn)比較大,2個(gè)維度對(duì)類別2總的解釋度只能達(dá)到70.2%,可以考慮是否加入第三維度。兩個(gè)維度對(duì)類別1的貢獻(xiàn)度差異不大。
圖列點(diǎn)總覽表結(jié)果圖
上述輸出結(jié)果為列變量(發(fā)展能力)各類別的分析結(jié)果概況,主要給出了各類別在各維度上的評(píng)分,以及相應(yīng)的信息貢獻(xiàn)量兩大類信息。
Mass(質(zhì)量)是指列變量各類別的構(gòu)成比,例如類別1占總數(shù)的比為34.7%;Score in Dimension(維中的得分)給出列變量各類別在相關(guān)維度上的評(píng)分,也就是列變量各狀態(tài)在二維圖中的坐標(biāo)值;Inertia(慣量)反映的是總慣量中分別由各列變量類別所提供的部分,數(shù)值越大,說明該類別對(duì)總慣量的貢獻(xiàn)越大;Contribution(貢獻(xiàn))分為點(diǎn)對(duì)維數(shù)的慣量和維數(shù)對(duì)點(diǎn)的慣量。點(diǎn)對(duì)維數(shù)的慣量說的是列變量各類別對(duì)每一個(gè)維度特征值的貢獻(xiàn)。維數(shù)對(duì)點(diǎn)的慣量說的是每一個(gè)維度對(duì)列變量各類別特征值的貢獻(xiàn)。由此可以更好的理解維度的來源及意義。
比如從點(diǎn)對(duì)維數(shù)的慣量部分,我們看到第一維度的信息主要被類別和4類別攜帶,即這兩個(gè)類別在第一維度上的區(qū)分度較好。我們看到第二維度的信息主要被1類別和2類別攜帶,即這兩個(gè)類別在第二維度上的區(qū)分度較好。
比如從維數(shù)對(duì)點(diǎn)的慣量部分,我們看到第一維度對(duì)3 4兩個(gè)類別貢獻(xiàn)比較大,第二維度對(duì)2類別貢獻(xiàn)比較大。兩個(gè)維度對(duì)類別1的貢獻(xiàn)度差異不大。前兩個(gè)維度對(duì)每個(gè)類別的解釋程度都超過了95%,說明兩個(gè)維度對(duì)各類別的解釋度是比較大的,不需要加入第三維度。
上圖中各類別散點(diǎn)在空間中的距離和位置就反映了各自間的關(guān)系,多數(shù)分析報(bào)告均只使用這張圖進(jìn)行描述。從上面的圖形可以看出,盈利能力最高的公司,可能發(fā)展能力只是中上水平。盈利能力中上的企業(yè),發(fā)展能力可能最差。盈利能力中下的企業(yè)可能發(fā)展能力最強(qiáng)。盈利能力最差的發(fā)展能力中下。
將上面整理的結(jié)果保存在文件夾中存為caiwu2.xlsx,以備后續(xù)使用。
如果想對(duì)連續(xù)變量進(jìn)行對(duì)應(yīng)分析先要將變量轉(zhuǎn)化為定序尺度變量或者名義尺度變量,再進(jìn)行對(duì)應(yīng)分析。如果兩個(gè)變量本來就是名義尺度變量則可以直接進(jìn)行對(duì)應(yīng)分析操作。
數(shù)據(jù)分析
想研究哪些因素對(duì)公司凈利率有影響,可以進(jìn)行回歸分析建模。
研究多個(gè)變量對(duì)一個(gè)變量的影響分析。
回歸分析 OLS VIF 方差膨脹因子 多重共線性
SPSS
對(duì)數(shù)據(jù)進(jìn)行回歸分析,并進(jìn)行顯著性檢驗(yàn)。具體`來講我們研究資產(chǎn)負(fù)債率,流動(dòng)比率、速動(dòng)比率、產(chǎn)權(quán)比率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)對(duì)凈利率的影響。
Caiwu.sav
操作步驟:
? 啟動(dòng)spss
? 打開caiwu.sav
? 執(zhí)行“分析”,“回歸”,“線性”命令;
? 將凈利率拉入“因變量”框里;
? 將“資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、產(chǎn)權(quán)比率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)”拉入“自變量”框里,其他默認(rèn);
? 點(diǎn)擊“statistics”選項(xiàng),選中“共線性診斷”,點(diǎn)擊“繼續(xù)”按鈕。點(diǎn)擊“確定”按鈕。
圖18 方差分析結(jié)果圖
由上述分析結(jié)果可知,回歸方程整體顯著性的統(tǒng)計(jì)檢驗(yàn)量F值為12.098,其相應(yīng)的P值遠(yuǎn)小于0.05,表明在0.05的顯著性水平下,整個(gè)回歸方程是顯著的。
圖19系數(shù)輸出結(jié)果
上述的輸出結(jié)果為各個(gè)變量的系數(shù)顯著性t檢驗(yàn)以及系數(shù)值。由輸出結(jié)果可知,資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、總資產(chǎn)周轉(zhuǎn)率這幾個(gè)變量都不顯著,但是上一步的輸出結(jié)果表明,整個(gè)方程又是顯著的,分析原因可能是多重共線性引起的,因?yàn)檫@幾個(gè)解釋變量的方差膨脹因子(VIF)比較大,一般VIF值超過10,就表明存在共線性。解決的方案是:將變量速動(dòng)比率、流動(dòng)比率、總資產(chǎn)周轉(zhuǎn)率按照VIF值的大小,首先將VIF值最大的變量從方程中去掉,重新估計(jì)方程,直到所有的變量都顯著為止。除了直接刪除變量之外,存在多重共線性的情況下,還可以使用偏最小二乘估計(jì),嶺回歸、lasso等方法進(jìn)行處理。我們在這里采用的是刪除變量的方法。結(jié)合變量的經(jīng)濟(jì)意義,經(jīng)過反復(fù)修改,我們最終得到的模型結(jié)果如下:
圖20 方差分析結(jié)果
圖21 系數(shù)結(jié)果圖
上述輸出結(jié)果為最終的回歸結(jié)果,可以看出,整個(gè)方程通過了顯著性檢驗(yàn),所有的變量都通過了系數(shù)的顯著性檢驗(yàn),資產(chǎn)負(fù)債率前面的系數(shù)為正,說明資產(chǎn)負(fù)債率越高,則凈利率越高。產(chǎn)權(quán)比率前面的系數(shù)為負(fù),說明產(chǎn)權(quán)比率越高,則凈利率越低,應(yīng)收賬款周轉(zhuǎn)天數(shù)越長,則凈利率越低,存貨周轉(zhuǎn)天數(shù)越長,則凈利率越高。系數(shù)的解釋為:在其他條件不變時(shí),每增加1單位的資產(chǎn)負(fù)債率,則凈利率平均增加0.408個(gè)單位。其他變量的解釋均可以以此類推。
該知識(shí)點(diǎn)的操作沒有產(chǎn)生新的變量。
如果解釋變量是數(shù)值變量可以直接加入到回歸模型中進(jìn)行回歸分析,如果模型存在嚴(yán)重的共線性問題,可以采用刪除變量的方法克服共線性問題。
數(shù)據(jù)分析
如果模型被解釋變量是0 1變量即被解釋變量只有兩個(gè)取值,則不適合建立普通回歸模型,建議建立logistic回歸模型。
如果被解釋變量只有0,1兩個(gè)取值,這樣的離散被解釋變量不再適合普通的回歸,需要采用logistic回歸進(jìn)行分析,在本案例中,被解釋變量為st狀態(tài),0表示非st狀態(tài),1表示st狀態(tài)。
個(gè)案選擇 logistic回歸分析 二元選擇模型 離散因變量模型 逐步回歸 多重貢獻(xiàn)性
樣本外預(yù)測 樣本內(nèi)預(yù)測 模型預(yù)測 隨機(jī)選擇樣本 過濾變量的生成
SPSS
研究資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、產(chǎn)權(quán)比率、加權(quán)凈資產(chǎn)收益率、攤薄總資產(chǎn)報(bào)酬率、毛利率、凈利率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)、營業(yè)收入增長率、總資產(chǎn)增長率、資本積累率等指標(biāo)對(duì)公司st狀態(tài)的影響。
Caiwu.sav
? 啟動(dòng)spss
? 打開caiwu.sav
? 依次點(diǎn)擊“數(shù)據(jù)”,“選擇個(gè)案”,在選擇欄的“隨機(jī)個(gè)案樣本”對(duì)話框中改為大約80所有個(gè)案的%,在輸出欄中選擇“過濾掉未選定的個(gè)案”,點(diǎn)擊“確定”;
? 然后再次點(diǎn)擊“數(shù)據(jù)”,“選擇個(gè)案”,在選擇欄中選擇“全部個(gè)案”,點(diǎn)擊“確定”;
? 依次點(diǎn)擊“分析”,“回歸”,“二元logistic回歸”,將ST狀態(tài)拉入“因變量”框里, “資產(chǎn)負(fù)債率、流動(dòng)比率、速動(dòng)比率、產(chǎn)權(quán)比率、加權(quán)凈資產(chǎn)收益率、攤薄總資產(chǎn)報(bào)酬率、毛利率、凈利率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)天數(shù)、存貨周轉(zhuǎn)天數(shù)、營業(yè)收入增長率、總資產(chǎn)增長率、資本積累率”拉入“協(xié)變量”框里。考慮到解釋變量之間可能存在多重共線性問題,在“方法”選項(xiàng)框后選擇“向前LR”方法,將“大約個(gè)案的80%(sample)[filter_$]”拉入“選擇變量”框里,點(diǎn)擊規(guī)則按鈕,值改為1,點(diǎn)擊“繼續(xù)”;
? 點(diǎn)擊“保存”按鈕,勾選“概率”和“組成員”,點(diǎn)擊“繼續(xù)”
? 點(diǎn)擊“確定”按鈕。
回歸經(jīng)過4步的變量添加,最終得到的方程step3,模型中僅包含攤薄總資產(chǎn)報(bào)酬率、存貨周轉(zhuǎn)天數(shù)、營業(yè)收入增長率三個(gè)變量。回歸結(jié)果見圖23。
圖23 方程式中的變量
我們只需要看圖23步驟3對(duì)應(yīng)的回歸分析結(jié)果(因?yàn)閺牟襟E0到步驟3是一個(gè)逐步添加變量的過程),從這個(gè)回歸結(jié)果可以看出,最終選擇的3個(gè)變量的系數(shù)2個(gè)通過了顯著性檢驗(yàn),存貨周轉(zhuǎn)天數(shù)雖然沒有通過顯著性檢驗(yàn),但是也被保留下來,說明其在提高模型擬合度上起了一些作用。攤薄總資產(chǎn)報(bào)酬率前面的系數(shù)在1%顯著性水平下顯著為負(fù),說明攤薄總資產(chǎn)報(bào)酬率越大,則被st的可能性越小。營業(yè)收入增長率前面的系數(shù)在1%顯著性水平下顯著為負(fù),說明營業(yè)收入增長率越大,則被st的可能性越大。雖然有的變量前面的系數(shù)符號(hào)和單個(gè)變量的相關(guān)性的系數(shù)符號(hào)可能不一樣,但是我們考慮的是方程的整體性,因此這種差異是可以接受的。
觀察數(shù)據(jù)集會(huì)發(fā)現(xiàn)數(shù)據(jù)中多了一個(gè)變量PGR_1,這是對(duì)st狀態(tài)的預(yù)測。我們還可以在輸出結(jié)果部分看到模型的預(yù)測效果,見圖24。
圖24 模型預(yù)測效果
從圖24可以看出,從步驟1到步驟3,模型的樣本內(nèi)預(yù)測效果不斷提升,分別為84.4%、86.7%、88.9%。模型樣本內(nèi)的預(yù)測效果確是步驟1的準(zhǔn)確率達(dá)到100%,步驟2和3準(zhǔn)確率反而有所下降將為了75%。原因?yàn)槲覀兊?/span>4個(gè)樣本的挑選有一定的隨機(jī)性,隨著預(yù)測樣本的增加,這種情況會(huì)明顯好轉(zhuǎn)的。整體來看,無論是樣本內(nèi)還是樣本外我們的預(yù)測效果都是比較好的。
將上面生成的過濾變量和預(yù)測結(jié)果變量保存在文件夾中存為caiwu4.xlsx,以備后續(xù)使用。
如果被解釋變量只有兩個(gè)取值,則可以建立二元選擇模型,如果模型存在嚴(yán)重的共線性問題,可以采用逐步回歸的方法克服共線性問題。為了檢驗(yàn)?zāi)P偷臉颖就忸A(yù)測能力,可以將數(shù)據(jù)分成兩部分,一部分作為訓(xùn)練集,一部分作為測試集,訓(xùn)練集用來估計(jì)模型參數(shù),測試集用來檢驗(yàn)?zāi)P偷臉颖就忸A(yù)測效果。將數(shù)據(jù)分成兩部分的時(shí)候可以用隨機(jī)選擇樣本的方式生成一個(gè)過濾變量。
學(xué)數(shù)據(jù)分析技能一定要了解的大廠入門券,CDA數(shù)據(jù)分析師認(rèn)證證書!
CDA(數(shù)據(jù)分析師認(rèn)證),與CFA相似,由國際范圍內(nèi)數(shù)據(jù)科學(xué)領(lǐng)域行業(yè)專家、學(xué)者及知名企業(yè)共同制定并修訂更新,迅速發(fā)展成行業(yè)內(nèi)長期而穩(wěn)定的全球大數(shù)據(jù)及數(shù)據(jù)分析人才標(biāo)準(zhǔn),具有專業(yè)化、科學(xué)化、國際化、系統(tǒng)化等特性。
同時(shí),CDA全??荚嚥季趾驼J(rèn)證體系已得到教育部直屬中國成人教育協(xié)會(huì)認(rèn)可,并由為IBM、華為等提供全球認(rèn)證服務(wù)的Pearson VUE面向全球提供靈活的考試服務(wù)。
報(bào)名方式
登錄CDA認(rèn)證考試官網(wǎng)注冊(cè)報(bào)名>>點(diǎn)擊報(bào)名
報(bào)名費(fèi)用
Level Ⅰ:1200 RMB
Level Ⅱ:1700 RMB
Level Ⅲ:2000 RMB
考試地點(diǎn)
Level Ⅰ:中國區(qū)30+省市,70+城市,250+考場,考生可就近考場預(yù)約考試 >看看我所在的地哪里報(bào)名<
Level Ⅱ+Ⅲ:中國區(qū)30所城市,北京/上海/天津/重慶/成都/深圳/廣州/濟(jì)南/南京/杭州/蘇州/福州/太原/武漢/長沙/西安/貴陽/鄭州/南寧/昆明/烏魯木齊/沈陽/哈爾濱/合肥/石家莊/呼和浩特/南昌/長春/大連/蘭州>看看我所在的地哪里報(bào)名<
報(bào)考條件
業(yè)務(wù)數(shù)據(jù)分析師 CDA Level I >了解更多<
? 報(bào)考條件:無要求。
? 考試時(shí)間:隨報(bào)隨考。
建模分析師 CDA Level II >了解更多<
? 報(bào)考條件(滿足任一即可):
1、獲得CDA Level Ⅰ認(rèn)證證書;
2、本科及以上學(xué)歷,需從事數(shù)據(jù)分析相關(guān)工作1年以上;
3、本科以下學(xué)歷,需從事數(shù)據(jù)分析相關(guān)工作2年以上。
? 考試時(shí)間:
一年四屆 3月、6月、9月、12月的最后一個(gè)周六。
大數(shù)據(jù)分析師 CDA Level II >了解更多<
? 報(bào)考條件(滿足任一即可):
1、獲得CDA Level Ⅰ認(rèn)證證書;
2、本科及以上學(xué)歷,需從事數(shù)據(jù)分析相關(guān)工作1年以上;
3、本科以下學(xué)歷,需從事數(shù)據(jù)分析相關(guān)工作2年以上。
? 考試時(shí)間:
一年四屆 3月、6月、9月、12月的最后一個(gè)周六。
數(shù)據(jù)科學(xué)家 CDA Level III >了解更多<
? 報(bào)考條件(滿足任一即可):
1、獲得CDA Level Ⅱ認(rèn)證證書;
2、本科及以上學(xué)歷,需從事數(shù)據(jù)分析相關(guān)工作3年以上;
3、本科以下學(xué)歷,需從事數(shù)據(jù)分析相關(guān)工作4年以上。
? 考試時(shí)間:
一年四屆 3月、6月、9月、12月的最后一個(gè)周六。
(備注:數(shù)據(jù)分析相關(guān)工作不限行業(yè),可涉及統(tǒng)計(jì),數(shù)據(jù)分析,數(shù)據(jù)挖掘,數(shù)據(jù)庫,數(shù)據(jù)管理,大數(shù)據(jù)架構(gòu)等內(nèi)容。)
——熱門課程推薦:
想學(xué)習(xí)PYTHON數(shù)據(jù)分析與金融數(shù)字化轉(zhuǎn)型精英訓(xùn)練營,您可以點(diǎn)擊>>>“人才轉(zhuǎn)型”了解課程詳情;
想從事業(yè)務(wù)型數(shù)據(jù)分析師,您可以點(diǎn)擊>>>“數(shù)據(jù)分析師”了解課程詳情;
想從事大數(shù)據(jù)分析師,您可以點(diǎn)擊>>>“大數(shù)據(jù)就業(yè)”了解課程詳情;
想成為人工智能工程師,您可以點(diǎn)擊>>>“人工智能就業(yè)”了解課程詳情;
想了解Python數(shù)據(jù)分析,您可以點(diǎn)擊>>>“Python數(shù)據(jù)分析師”了解課程詳情;
想咨詢互聯(lián)網(wǎng)運(yùn)營,你可以點(diǎn)擊>>>“互聯(lián)網(wǎng)運(yùn)營就業(yè)班”了解課程詳情;
想了解更多優(yōu)質(zhì)課程,請(qǐng)點(diǎn)擊>>>
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10