99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀【從零開始學(xué)統(tǒng)計(jì)】8.樣本好才是真的好!
【從零開始學(xué)統(tǒng)計(jì)】8.樣本好才是真的好!
2014-07-04
收藏
之前做的幾個(gè)系列都得到了大家的支持,也有很多童鞋指出了樓主寫的紕漏,樓主很感謝大家(這樣才能有進(jìn)步嘛……)。
       那么這次樓主想說說抽樣的問題。抽樣這個(gè)話題,其實(shí)有那么點(diǎn)……一般作分析的都是處于數(shù)據(jù)處理或者處理的后期了,而抽樣問題則是在設(shè)計(jì)樣本抽樣框時(shí)會遇到的,屬于數(shù)據(jù)搜集的前期(甚至決定著數(shù)據(jù)的搜集)。做后期的,前期怎樣其實(shí)后期的并不關(guān)心,但如何抽樣卻能決定樣本的好壞,大致了解下總有好處(當(dāng)然繁雜的諸如如何確定樣本量之類的公式這里就不出現(xiàn)了)。

首先,暫從概念講起:
       簡單隨機(jī)抽樣也稱單純隨機(jī)抽樣,是指從總體N個(gè)單位中任意抽取n個(gè)單位作為樣本,使每個(gè)可能被抽中樣本概率相等的一種抽樣方式。
       分層抽樣又稱分類抽樣或類型抽樣,它首先將總體的N個(gè)單位分成互不交叉、互不重復(fù)的k個(gè)部分,我們稱之為層;然后在每個(gè)層內(nèi)分別抽選n1、n2、... nk個(gè)樣本。
  • 分層抽樣的優(yōu)點(diǎn):分層抽樣的優(yōu)點(diǎn)是可以降低總的抽樣誤差,在全國性抽樣調(diào)查設(shè)計(jì)中經(jīng)常使用分層抽樣方法。
        整群抽樣是首先將總體中各單位歸并成若干互不交叉、互不重復(fù)的集合,稱之為群;然后以群為抽樣單位抽取樣本的一種抽樣方式。
  • 整群抽樣的優(yōu)點(diǎn):整群抽樣的優(yōu)點(diǎn)是實(shí)施方便、節(jié)省經(jīng)費(fèi);缺點(diǎn)是往往由于不同群之間的差異較大,由此而引起的抽樣誤差往往大于簡單隨機(jī)抽樣。在全國性人口、社會抽樣調(diào)查中,整群抽樣是經(jīng)常采用的方法。
       等距抽樣也稱系統(tǒng)抽樣或機(jī)械抽樣,它首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔。然后隨機(jī)確定起點(diǎn),每隔一定間隔抽取一個(gè)單位。等距抽樣在全國性人口、社會抽樣調(diào)查中經(jīng)常采用。還有很多其他的抽樣方法比如多階段抽樣,雙重抽樣,PPS抽樣等……這里就不做贅述了。
       這些抽樣方法往往我們會結(jié)合起來一起用,比如,我們要了解某市400個(gè)國營企業(yè)的生產(chǎn)經(jīng)營情況,決定采取類型隨機(jī)抽樣法抽取20個(gè)企業(yè)作為樣本進(jìn)行調(diào)查。那么首先,將這400個(gè)企業(yè)按產(chǎn)業(yè)(也可按行政區(qū)劃、盈利情況、規(guī)模大小等)分為三類,假定第一類產(chǎn)業(yè)40個(gè),第二類產(chǎn)業(yè)200個(gè),第三類產(chǎn)業(yè)160個(gè)。然后,按各類企業(yè)在總體中的比重,確定各類企業(yè)抽取樣本單位的數(shù)量。其中,第一類產(chǎn)業(yè)的企業(yè)占總體10%,按比例應(yīng)抽樣本企業(yè)2個(gè);按同樣方法計(jì)算,第二類產(chǎn)業(yè)中應(yīng)抽樣本企業(yè)10個(gè),第三類產(chǎn)業(yè)中應(yīng)抽樣本企業(yè)8個(gè)。最后,采用簡單隨機(jī)抽樣或等距隨機(jī)抽樣方法,從各類企業(yè)中抽出上述數(shù)量的樣本單位。那么這個(gè)小例子中就先分層然后再用簡單或者系統(tǒng)抽樣法。

☆提問時(shí)間到:
Q:整群抽樣和分層抽樣有什么區(qū)別?
A:這個(gè)問題在剛接觸抽樣,特別是當(dāng)老師吧啦吧啦說了一大堆不同的抽樣方法后,腦子會出現(xiàn)短時(shí)間的短路~~于是這個(gè)問題就冒出來了。我相信不是樓主一個(gè)人產(chǎn)生過這個(gè)疑問。簡單點(diǎn)說吧,整群和分層都是把總體給劃分開來,區(qū)別在于一個(gè)是對群的隨機(jī),一個(gè)是對層內(nèi)的隨機(jī)。一個(gè)總體可以分為N個(gè)群,然后在群內(nèi)進(jìn)行普查,于是整群抽樣出現(xiàn)了;而根據(jù)差異將總體分層,然后在層內(nèi)進(jìn)行隨機(jī)抽樣即使分層抽樣了(樓主表達(dá)上的不嚴(yán)謹(jǐn)歡迎大家即使拍磚指出)。最后一句話總結(jié):先分群再普查=整群抽樣;先區(qū)分在隨機(jī)=分層抽樣。兩者在劃分層或群的時(shí)候也有區(qū)別:分層希望層與層之間區(qū)別越大越好但層內(nèi)則差異越小越好;整群則希望群與群之間差異越小越好,這樣抽出的群才不會太偏。

Q:如何決定用哪種抽樣方法??
A:由于三種抽樣方法適應(yīng)的范圍不同,對于給定的抽樣問題首先要選擇相匹配的抽樣方法.只有理解三種抽樣方法的含義,才會做到這一點(diǎn).看下面的幾個(gè)例子:
    問題1:某市為了支援西部教育事業(yè),現(xiàn)從報(bào)名的18名志愿者中選取6人組成志愿小組.為了保證對每個(gè)志愿者的公平性,如何確定志愿小組的名單.
    問題2:某學(xué)校有在編教師160人.其中老年教師16人,中年教師112人,青年教師32人.教育部門為了了解教師的健康狀況,要從中抽取一個(gè)容量為20的樣本.試確定用何種方法抽取.
    問題3:某工廠平均每天生產(chǎn)某種零件大約1000件,要求產(chǎn)品檢驗(yàn)員每天抽取50件,檢查其質(zhì)量狀況.試問運(yùn)用那種抽樣方法最合理.
    剖析:問題1的總體中的個(gè)體數(shù)目較少,運(yùn)用簡單隨機(jī)抽樣法抽樣;簡單隨機(jī)抽樣法有兩種,分別為抽簽法和隨機(jī)數(shù)法,兩法皆適合此題;問題2中的總體由差異明顯的幾部分組成,故采用分層抽樣法抽樣;問題3中的總體容量大,樣本容量也大,可用系統(tǒng)抽樣法抽樣.

四種抽樣方法的抽樣誤差大小一般是:整群抽樣≥單純隨機(jī)抽樣≥系統(tǒng)抽樣≥分層抽樣

360截圖20140522214020856.jpg

那么接下去大家一定關(guān)心樣本大小的確定,樣本容量的大小取決于許多因素,其中主要有以下三方面:
  1. 研究對象總體的性質(zhì)。總體的大小及其分布的離散程序是決定樣本大小的首要條件。一般來說,總體越大,相應(yīng)需要的樣本容量越大??傮w的離散程度越大,相應(yīng)需要的樣本容量也越大。
  2. 研究目標(biāo)、方法和研究者的經(jīng)費(fèi)、經(jīng)驗(yàn)、時(shí)間、精力等主客觀條件。
  3. 研究結(jié)果的統(tǒng)計(jì)分析方法。一般情況下不小于30,這是根據(jù)樣本分布的原理確定的。因素分析等多元統(tǒng)計(jì)方法,所需的樣本容量一般為變量的10-20倍,最少不能少于5倍。若是為了檢驗(yàn)誤差和推論可能出現(xiàn)的錯(cuò)誤的概率,需要用公式計(jì)算樣本數(shù)目(具體的方法可參閱有關(guān)統(tǒng)計(jì)方面的書籍)當(dāng)中涉及的情況過多,這里不作介紹。

tips:在計(jì)算樣本容量時(shí),必須知道總體的方差,而在實(shí)際抽樣調(diào)查前,往往總體的方差是未知的。在實(shí)際操作時(shí),可以用過去的資料,若過去曾有若干個(gè)方差,應(yīng)該選擇最大的,以保證抽樣估計(jì)的精確度;也可以進(jìn)行一次小規(guī)模的調(diào)查,用調(diào)查所得的樣本方差來替代總體的方差。

       困惑的是:既然總體是要調(diào)查的,若這個(gè)總體本沒有任何歷史資料可供參考,小規(guī)模的調(diào)查本身就是一次抽樣,那這小規(guī)模的抽樣樣本容量怎么確定?(這貌似進(jìn)入死循環(huán)了……)有木有同志能給個(gè)解決辦法?。?/span>

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }