99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀SPSS分類分析:最近鄰元素分析
SPSS分類分析:最近鄰元素分析
2017-11-15
收藏

SPSS分類分析:最近鄰元素分析

一、最近鄰元素分析(分析-分類-最近鄰元素)

1、概念:根據(jù)個(gè)案間的相似性來對個(gè)案進(jìn)行分類。類似個(gè)案相互靠近,而不同個(gè)案相互遠(yuǎn)離。因此,通過兩個(gè)個(gè)案之間的距離可以測量他們的相似性。相互靠近的個(gè)案稱為“鄰元素?!碑?dāng)出現(xiàn)新個(gè)案(保持)時(shí),將計(jì)算它與模型中每個(gè)個(gè)案之間的距離。計(jì)算得出最相似個(gè)案–最近鄰元素–的分類,并將新個(gè)案放入包含最多最近鄰元素的類別中。

2、變量:(分析-分類-最近鄰元素-變量)

◎目標(biāo)(可選)。如果未指定目標(biāo)(因變量或響應(yīng)),則過程僅查找k個(gè)最近鄰元素–而不會執(zhí)行任何分類或預(yù)測。◎標(biāo)準(zhǔn)化刻度特征。標(biāo)準(zhǔn)化特征具有相同的值范圍,這可改進(jìn)估計(jì)算法的性能。使用經(jīng)調(diào)整后的標(biāo)準(zhǔn)化[2*(x min)/(max min)] 1。調(diào)整后的標(biāo)準(zhǔn)化值介于1和1之間。◎焦點(diǎn)個(gè)案標(biāo)識(可選)。這可以標(biāo)記感興趣的個(gè)案。例如,研究員希望確定學(xué)區(qū)的測驗(yàn)分?jǐn)?shù)–焦點(diǎn)個(gè)案–是否與類似學(xué)區(qū)的測驗(yàn)分?jǐn)?shù)相當(dāng)。他使用最近鄰元素分析來查找在給定特征組方面最相似的學(xué)區(qū)。然后,他將焦點(diǎn)學(xué)區(qū)的測驗(yàn)分?jǐn)?shù)與最近鄰學(xué)區(qū)的分?jǐn)?shù)進(jìn)行比較。◎個(gè)案標(biāo)簽(可選)。在特征空間圖表、對等圖表和象限圖中使用這些值來標(biāo)記個(gè)案。

3、相鄰元素:(分析-分類-最近鄰元素-相鄰元素)

1)最近鄰元素的數(shù)目(k)。指定最近鄰元素的數(shù)目。注意,使用大量的鄰元素不一定會得到更準(zhǔn)確的模型。2)距離計(jì)算。該度規(guī)用于指定在測量個(gè)案相似性中使用的距離度規(guī)?!駿uclidean度規(guī)。兩個(gè)個(gè)案x和y之間的距離,為個(gè)案值之間的平方差在所有維度上之和的平方根?!虺鞘薪謪^(qū)度規(guī)。兩個(gè)個(gè)案之間的距離是個(gè)案值之間絕對差在所有維度上之和。又稱為Manhattan距離。

4、特征:(分析-分類-最近鄰元素-特征

如果在“變量”選項(xiàng)卡中指定了目標(biāo),使用“特征”選項(xiàng)卡可以為特征選擇請求或指定選項(xiàng)。默認(rèn)情況下,特征選擇會考慮所有特征,但可以選擇特征子集以強(qiáng)制納入模型。

中止準(zhǔn)則。在每一步上,如果添加特征可以使誤差最小(計(jì)算為分類目標(biāo)的誤差率和刻度目標(biāo)的平方和誤差),則考慮將其納入模型中。繼續(xù)向前選擇,直到滿足指定的條件?!蛑付ǖ?a href='/map/tezheng/' style='color:#000;font-size:inherit;'>特征數(shù)目。除了那些強(qiáng)制納入模型的特征外,算法還會添加固定數(shù)目的特征。指定一個(gè)正整數(shù)。減少所選擇的數(shù)目值可以創(chuàng)建更簡約的模型,但存在缺失重要特征的風(fēng)險(xiǎn)。增加所選擇的數(shù)目值可以涵蓋所有重要特征,但又存在因特征添加而增加模型誤差的風(fēng)險(xiǎn)?!蚪^對誤差比率的最小變化。當(dāng)絕對誤差比率變化表明無法通過添加更多特征來進(jìn)一步改進(jìn)模型時(shí),算法會停止。指定一個(gè)正數(shù)。減少最小變化值將傾向于包含更多特征,但存在包含對模型價(jià)值不大的特征的風(fēng)險(xiǎn)。增加最小變化值將傾向于排除更多特征,但存在丟失對模型較重要的特征的風(fēng)險(xiǎn)。最小變化的“最佳”值將取決于您的數(shù)據(jù)和具體應(yīng)用。請參見輸出中的“特征選擇誤差日志”,以幫助您評估哪些特征最重要。

5、分區(qū)(分析-分類-最近鄰元素-分區(qū)

使用“分區(qū)”選項(xiàng)卡可以將數(shù)據(jù)集劃分為培訓(xùn)和堅(jiān)持集,并在適當(dāng)時(shí)候?qū)€(gè)案分配給交叉驗(yàn)證折。

1)訓(xùn)練和堅(jiān)持分區(qū)。此組指定將活動(dòng)數(shù)據(jù)集劃分為訓(xùn)練樣本或堅(jiān)持樣本的方法。訓(xùn)練樣本包含用于訓(xùn)練最近鄰元素模型的數(shù)據(jù)記錄;數(shù)據(jù)集中的某些個(gè)案百分比必須分配給訓(xùn)練樣本以獲得一個(gè)模型。堅(jiān)持樣本是用于評估最終模型的獨(dú)立數(shù)據(jù)記錄集;堅(jiān)持樣本的誤差給出一個(gè)模型預(yù)測能力的“真實(shí)”估計(jì)值,因?yàn)閳?jiān)持個(gè)案不用于構(gòu)建模型?!螂S機(jī)分配個(gè)案到分區(qū)。指定分配給訓(xùn)練樣本的個(gè)案百分比。其余的分配給堅(jiān)持樣本?!蚴褂米兞糠峙鋫€(gè)案。指定一個(gè)將活動(dòng)數(shù)據(jù)集中的每個(gè)個(gè)案分配到訓(xùn)練或堅(jiān)持樣本中的數(shù)值變量。變量為正值的個(gè)案被分配到訓(xùn)練樣本中,值為0或負(fù)值的個(gè)案被分配到堅(jiān)持樣本中。具有系統(tǒng)缺失值的個(gè)案會從分析中排除。分區(qū)變量的任何用戶缺失值始終視為有效。

2)交叉驗(yàn)證折。V折交叉驗(yàn)證用于確定“最佳”鄰元素?cái)?shù)目。因性能原因,它無法與特征選擇結(jié)合使用。交叉驗(yàn)證將樣本劃分為許多子樣本,或折。然后,生成最近鄰元素模型,并依次排除每個(gè)子樣本中的數(shù)據(jù)。第一個(gè)模型基于第一個(gè)樣本折的個(gè)案之外的所有個(gè)案,第二個(gè)模型基于第二個(gè)樣本折的個(gè)案之外的所有個(gè)案,依此類推。對于每個(gè)模型,估計(jì)其錯(cuò)誤的方法是將模型應(yīng)用于生成它時(shí)所排除的子樣本?!白罴选弊罱徳?cái)?shù)為在折中產(chǎn)生最小誤差的數(shù)量?!螂S機(jī)分配個(gè)案到折。指定應(yīng)當(dāng)用于交叉驗(yàn)證的折數(shù)。該過程將個(gè)案隨機(jī)分配到折,從1編號到V(折數(shù))。◎使用變量分配個(gè)案。指定一個(gè)將活動(dòng)數(shù)據(jù)集中的每個(gè)個(gè)案分配到折中的數(shù)值變量。變量必須為數(shù)值,其值為從1到V的數(shù)字。如果此范圍中的任何值缺失,且位于任何拆分上(如果拆分文件有效),這將導(dǎo)致誤差。

3)為Mersenne扭曲器設(shè)置種子。設(shè)置種子允許您復(fù)制分析。使用此控件類似于將“Mersenne扭曲器”設(shè)為活動(dòng)生成器并在“隨機(jī)數(shù)生成器”對話框中指定固定起始點(diǎn),兩者的重大差別在于在此對話框中設(shè)置種子會保留隨機(jī)數(shù)生成器的當(dāng)前狀態(tài)并在分析完成后恢復(fù)該狀態(tài)。

二、結(jié)果說明(運(yùn)行后的結(jié)果解釋)

1、模型視圖:在“輸出”選項(xiàng)卡中選擇圖表和表時(shí),過程會在查看器中創(chuàng)建“最近鄰元素模型”對象。激活(雙擊)該對象,可獲得模型的交互式視圖。此模型視圖有2個(gè)面板窗口:◎第一個(gè)面板顯示模型概覽,稱為主視圖?!虻诙€(gè)面板顯示兩種視圖類型之一

2、特征空間:特征空間圖表是有關(guān)特征空間(如果存在3個(gè)以上特征,則為子空間)的交互式圖形。每條軸代表模型中的某個(gè)特征,圖表中的點(diǎn)位置顯示個(gè)案這些特征在培訓(xùn)和堅(jiān)持分區(qū)中的值。

3、變量重要性:通常,您將需要將建模工作專注于最重要的變量,并考慮刪除或忽略那些最不重要的變量。變量重要性圖表可以在模型估計(jì)中指示每個(gè)變量的相對重要性,從而幫助您實(shí)現(xiàn)這一點(diǎn)。由于它們是相對值,因此顯示的所有變量的值總和為1.0。變量重要性與模型精度無關(guān)。它只與每個(gè)變量在預(yù)測中的重要性有關(guān),而不涉及預(yù)測是否精確。

4、對等:該圖表顯示焦點(diǎn)個(gè)案及其在每個(gè)特征和目標(biāo)上k個(gè)最近鄰元素。它僅在“特征空間”圖表中選擇了焦點(diǎn)個(gè)案時(shí)可用。

5、最近鄰元素距離:該表只顯示焦點(diǎn)個(gè)案的k個(gè)最近鄰元素與距離。它僅當(dāng)在“變量”選項(xiàng)卡上指定了焦點(diǎn)個(gè)案標(biāo)識符時(shí)可用,且僅顯示由此變量標(biāo)識的焦點(diǎn)個(gè)案。

6、象限圖:該圖表顯示焦點(diǎn)個(gè)案及其在散點(diǎn)圖(點(diǎn)圖,取決于目標(biāo)的測量級別)上k個(gè)最近鄰元素。目標(biāo)在y軸上,刻度特征在x軸上,按特征劃分面板。它僅當(dāng)存在目標(biāo),且在“特征空間”圖表中選擇了焦點(diǎn)個(gè)案時(shí)可用。

7、特征選擇誤差日志:對于該圖表上的點(diǎn),其y軸值為模型的誤差(誤差率或平方和誤差,取決于目標(biāo)的測量級別),x軸上列出模型的特征(加上x軸左側(cè)的所有特征)。該圖表僅當(dāng)存在目標(biāo),且特征選擇有效時(shí)可用。

8、K選擇誤差日志:對于該圖表上的點(diǎn),其y軸值為模型的誤差(誤差率或平方和誤差,取決于目標(biāo)的測量級別),x軸上為最近鄰元素?cái)?shù)目(k)。該圖表僅當(dāng)存在目標(biāo),且k選擇有效時(shí)可用。

9、分類表:該表顯示按分區(qū)對目標(biāo)觀察與預(yù)測值的交叉分類。它僅當(dāng)存在分類目標(biāo)時(shí)可用。堅(jiān)持分區(qū)中的(缺失)行包含在目標(biāo)上具有缺失值的堅(jiān)持個(gè)案。這些個(gè)案對“堅(jiān)持樣本:整體百分比”有貢獻(xiàn),但對“正確百分比”無影響。


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }