99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

spss:syntax對重復(fù)觀測值的處理

2016-10-30

spss:syntax對重復(fù)觀測值的處理

很早的時候，大家在SPSS中處理單個變量的重復(fù)值通常都是這樣的做法，首先將要處理的數(shù)據(jù)進行排序，然后將其復(fù)制后在從新變量的第二行開始粘貼，得到了兩個觀察量錯開一個位置的變量，然后對這兩個變量進行相減，最后挑選或刪除為零的選項以獲得完全無重復(fù)的數(shù)據(jù)。這樣的做起來不算困難，但處理2個或2個以上變量的重復(fù)值就顯得有點乏力了。下面就芒果的例子利用SPSS syntax對重復(fù)觀測值的處理進行相關(guān)探討，簡要數(shù)據(jù)如下：

問題1.找出上表中zkzh相同且itemid也相同的所有記錄。

關(guān)于sort cases/match files/filter等命令見下面小貼士的說明，首先看看數(shù)據(jù)處理結(jié)果：

問題2. 如何快速的分離出被篩選的變量？

還是利用上面的例子，我們利用dataset copy命令將被篩選出的觀測值快速的篩選出來，形成一個新的數(shù)據(jù)集。

#1 Filter off.

#2 Dataset copy shaixuanji.

#3 DATASET ACTIVATE shaixuanji.

#4 SELECT IF thesame=0.

#5 EXECUTE .

代碼解析：

第1行命令利用filter off命令清除上面的篩選效果。

第2行命令式將當前數(shù)據(jù)集復(fù)制到新的數(shù)據(jù)集shaixuanji中。

第3-4行命令是激活數(shù)據(jù)集shaixuanji，并且選擇thesame變量中值為0的觀測值（其他的默認刪除）。

第5行命令是即時運算命令。

效果如下：

如果不想要這么多的變量，可以使用save outfile.../keep(drop)命令選擇自己需要的變量。

問題3.有時候我們并不知道如何篩選重復(fù)值，而是事先觀察比較重復(fù)值的相關(guān)特性，然后做下一步的處理，那么如何選擇輸出重復(fù)值的相關(guān)信息呢？

這里還是利用最初的數(shù)據(jù)進行說明，由于目的不同，這里篩選查找重復(fù)觀測值的方式也不同。問題1中采用的是match files命令來處理重復(fù)值，這里換一種方法，利用aggregate分類匯總命令來計量重復(fù)值，進而作進一步的匯總說明，具體代碼如下：

#1 AGGREGATE OUTFILE = * MODE = ADDVARIABLES

#2 /BREAK = zkzh itemid

#3 /sameCount = N.

#4 SORT CASES BY sameCount (D).

#5 COMPUTE filtervar=(sameCount > 1).

#6 FILTER BY filtervar.

#7 SUMMARIZE

#8 /TABLES=zkzh itemid samecount

#9 /FORMAT=LIST NOCASENUM TOTAL

#10 /TITLE='重復(fù)值概述'

#11 /CELLS=COUNT.

代碼解析：

第1-3行命令利用aggregate命令在當前數(shù)據(jù)集中新增一個變量samecount記錄分組變量zkzh和itemid相同觀測值的數(shù)目，類似于GUI操作中的data--aggregate.

第4行命令對變量samecount進行降序排列.

第5行命令計算新變量filtervar，對其滿足條件samecount>1賦值1，否則賦值0.

第6行命令對數(shù)據(jù)集按變量filtercar進行篩選，filtervar變量中值為0或缺失的都將被過濾.

第7-11行是制表命令，等同于GUI菜單操作中的analyze--reports--case summarises，第8行選擇表中的計量變量，這里選擇了zkzh等3個變量，第9-10行則是對表格的格式及標題進行設(shè)置，第11行是相關(guān)統(tǒng)計量的選擇，這里選擇的是count，除此之外還可以選擇max\range\sum等其他統(tǒng)計量。

輸出結(jié)果：

小貼士：

Filter

Filter命令是用來從當前數(shù)據(jù)集中排除觀測值而不刪除觀測值的命令。當變量的觀測值為0或缺失時這些觀測值將被過濾掉（SPSS中的表現(xiàn)效果為）。Filter相關(guān)命令規(guī)則：

1）只允許指定一個數(shù)值變量（該變量可以是原始變量或數(shù)據(jù)轉(zhuǎn)換變量）

2）使用filter off后，恢復(fù)過濾掉的觀測值

3）當filter命令不包含子命令時，將按filter off命令進行等效處理，等SPSS output窗口會提示警告信息

4）Filter可以用在syntax語句的任何位置，和select if命令不同的是，filter命令在input program語句中也有同樣的效果。需要注意的是這里的篩選變量需要時數(shù)據(jù)轉(zhuǎn)換變量。

其他說明：

1）filter命令并沒有改變當前數(shù)據(jù)集；

2）filter命令并沒有提供觀測值的選擇過濾標準，系統(tǒng)缺失和用戶自定義缺失值，都將被過濾掉

3）如果filter的變量名改變了，篩選效果仍然有效；但是篩選變量如果轉(zhuǎn)換為字符變量時，filter命令效果將會消失

4）如果當前數(shù)據(jù)集被match files，add files或update等命令更改后，過濾變量未發(fā)生變化，filter命令仍然有效

5）如果當前數(shù)據(jù)集被一個新的數(shù)據(jù)集代替，filter命令將關(guān)閉

MATCH FILES

Match files命令可合并2個或2個以上含有相同觀測值但不同變量的數(shù)據(jù)文件。例如，合并銷售人員的信息和銷售業(yè)績，有點類似于數(shù)據(jù)庫中的select操作。最多可以合并50個數(shù)據(jù)文件。例如，合并數(shù)據(jù)part1,part2及當前數(shù)據(jù)及可以用下面的代碼，如果怕數(shù)據(jù)合并錯誤，可以先對這些數(shù)據(jù)集進行排序，然后利用by子命令根據(jù)排序變量進行合并，還可以利用last或first子命令賦值1說明重復(fù)值位置。

MATCH FILES FILE='/data/part1.sav'

/FILE='/data/part2.sav'

/FILE=*.

SORT Cases

Sort cases基于一個或多個變量進行排序，可以是升序（a）或降序(d),也可以是升序降序的組合。(默認為升序)，Sort cases相關(guān)說明:

1)關(guān)鍵詞by是可選的

2)By排序的變量可以是數(shù)字變量或字符變量，但不能是系統(tǒng)變量或臨時變量（#various）

3)Sort cases是按變量順序進行排序的，優(yōu)先排序第一變量

4)Sort cases指定排序變量不能超過64個

例如：SORT CASES BY var1(A) var2(D).

*首先對變量1進行升序排列，然后再此基礎(chǔ)上按變量2進行降序排列.

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學習CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇回歸系列（一）| 怎樣正確地理解線性回歸

下一篇2020美國總統(tǒng)競選大戲開鑼，川普當選的奇跡會再發(fā)生嗎？

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

spss:syntax對重復(fù)觀測值的處理

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學習

數(shù)據(jù)分析師資訊

CDA 精益業(yè)務(wù)數(shù)據(jù)分析：數(shù)據(jù)驅(qū)動業(yè)務(wù)增長的實戰(zhàn)方法 ...

【CDA干貨】MySQL 中 ADD KEY 與 ADD INDEX 詳解： ...

解析 MySQL Update 語句中 “query end” 狀態(tài)：含 ...

如何考取數(shù)據(jù)分析師證書：以 CDA 為例 ...

CDA 精益業(yè)務(wù)數(shù)據(jù)分析：驅(qū)動企業(yè)高效決策的核心引擎 ...

【CDA干貨】MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實戰(zhàn)：數(shù)據(jù) ...

【CDA干貨】Python Pandas：數(shù)據(jù)科學的瑞士軍刀 ...

【CDA干貨】用 SQL 生成逆向回滾 SQL：數(shù)據(jù)操作的 ...

【CDA干貨】t檢驗與Wilcoxon檢驗的選擇：何時用t.te ...

AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師——開啟新時 ...

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報考條件詳解與準備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計的實用指南 ...

CDA 認證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者 ...

SQL 在預(yù)測分析中的應(yīng)用：從數(shù)據(jù)查詢到趨勢預(yù)判 ...

數(shù)據(jù)查詢結(jié)束后：分析師的收尾工作與價值深化 ...

CDA 數(shù)據(jù)分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數(shù)據(jù)背后的時間 ...

year_month數(shù)據(jù)類型：時間維度的精準切片 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載