2020-05-26
閱讀量:
1148
統(tǒng)計(jì)學(xué):主成分分析基本思想
主成分分析是一類常用的針對(duì)數(shù)值型變量的降維方法,選取能夠最大化解釋數(shù)據(jù)變異的成分,將數(shù)據(jù)從高維降到低維,同時(shí)保證各個(gè)維度之間正交。
主成分分析適用于具有相關(guān)關(guān)系的變量,當(dāng)分析中所選的變量具有不同的量綱,且差別比較大的情況下,應(yīng)選擇相關(guān)系數(shù)矩陣進(jìn)行主成分分析。
主成分分析的具體方法是對(duì)變量的協(xié)方差矩陣或相關(guān)系數(shù)矩陣求取特征值和特征向量,經(jīng)證明,對(duì)應(yīng)最大特征值的特征向量,其方向正是協(xié)方差矩陣變異最大的方向,依次類推,第二大特征值對(duì)應(yīng)的特征向量,是與第一個(gè)特征向量正交且能最大程度解釋數(shù)據(jù)剩余變異的方向,而每個(gè)特征值則能夠衡量各方向上變異的程度。因此,進(jìn)行主成分分析時(shí),選取最大的幾個(gè)特征值對(duì)應(yīng)的特征向量,并將數(shù)據(jù)映射在這幾個(gè)特征向量組成的參考系中,達(dá)到降維的目的(選擇的特征向量數(shù)量低于原始數(shù)據(jù)的維數(shù))。






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論