
如何決定樣本量,是一個老生常談的話題,也有很多相關(guān)文章。然而翻看相關(guān)文章,就會發(fā)現(xiàn)介紹選多少合適的比較多,而介紹為什么這么選就合適的卻比較少。
相信很多用研同學(xué)都聽過這句著名的話:
根據(jù)尼爾森關(guān)于可用性測試的經(jīng)典理論,6-8人便可以找到產(chǎn)品80%以上的可用性問題。
但是……為啥呢?當(dāng)有“無知的”地球人問:為什么6-8人就能發(fā)現(xiàn)80%以上的問題時,難道我們要理直氣壯的說:因?yàn)槭悄釥柹f的么……
在樣本量選擇上似乎有一些“約定俗成”的規(guī)定。比如:可用性測試5-8人,問卷調(diào)研大約200-500份等等……但是,當(dāng)需要和地球人理論時,單單的“約定俗成”卻沒有足夠的說服力。不如讓我們一起來看看這些“約定俗成”背后的科學(xué)道理,讓自己更有底氣。
俗話說“8個用戶可以發(fā)現(xiàn)80%的問題”。其實(shí)這句話并不完整,完整的說法應(yīng)該是:
8個人可以80%的概率發(fā)現(xiàn)發(fā)生可能性大于18%的問題。
這話太繞了,嘗試用人話解釋一下:如果某個APP中存在一個BUG,100個人用,50個人用都會遇到,那么我們至少有80%的可能性發(fā)現(xiàn)。只要可能遇到的人大于18個(發(fā)生可能性大于18%),我們都至少有80%的可能性發(fā)現(xiàn)。但如果這個BUG只有5個人可會遇到,那么能發(fā)現(xiàn)的概率就要低于80%了。
之所以這么說,背后的原理是這樣一個公式:
(P(X≥1)是在n次嘗試中事件至少發(fā)生1次的概率,p是某事件的概率)
前輩們根據(jù)這個公式總結(jié)出了下表:
資料來源:《用戶體驗(yàn)度量》Jeff Sauro,James R.Lewis著,機(jī)械工業(yè)出版社,P134-135
從表中可以看出,決定樣本量涉及到兩個因素:一個是確定程度,一個是問題發(fā)生的概率。
再來具體看一看我們常說的“8個人”。
當(dāng)選擇8個人進(jìn)行測試時,可以100%發(fā)現(xiàn)發(fā)生概率大于50%的問題,90%的可能性發(fā)現(xiàn)發(fā)生概率大于25%的問題,73%的可能性發(fā)現(xiàn)發(fā)生概率大于15%的問題。
就好像天氣預(yù)報員說:100%的確定明天的降水概率大于50%,90%的確定明天的降水概率大于25%。
等等…這樣的話會不會被質(zhì)疑:8個人只能90%發(fā)現(xiàn)發(fā)生概率大于25%的問題,那發(fā)生概率低于25%的問題怎么辦?就不重要了么?
不如讓我們再來看看尼爾森關(guān)于釣魚的比喻:
假設(shè)你有好多個池塘可以釣魚,一些魚比另一些魚更容易抓到。所以,如果你有10小時,你會花10個小時都在一個池塘里釣魚,還是花5個小時在一個池塘上、花另外的5個小時在另一個池塘上呢? 為使抓到的魚數(shù)量最大化,你應(yīng)該在兩個池塘上都花一些時間,以便從每個池塘里都釣到容易釣的魚。
一次何必找那么多用戶,少做幾個用戶先把發(fā)生率高的問題get了,版本更新以后再繼續(xù)找用戶去get發(fā)生率高的問題,省時省力效果佳。
這樣是不是就可以完整的證明我們可用性測試做5-8個人的觀點(diǎn)了呢。
在做問卷調(diào)研的時候,如何估計樣本量?眾所周知有一個公式:
但是這個公式存在一個問題:我要是連總體方差(CV2)都能知道,還做個毛線調(diào)研。
如果想估算總體方差,需要先選取一批人進(jìn)行測試,得到一個樣本方差,用樣本方差代替總體方差,這在現(xiàn)實(shí)工作中顯然難以實(shí)現(xiàn)。于是為了便于計算,偉大的前輩對公式進(jìn)行了轉(zhuǎn)換:
資料來源:《社會研究方法》仇立平著,重慶大學(xué)出版社,P137
作者說這一轉(zhuǎn)換是根據(jù)“推論總體比例或百分比的原理”進(jìn)行的。姑且不去管這個轉(zhuǎn)換原理是什么,這個公式我們可以這樣來理解:當(dāng)p=0.5的時候,總體的差異性最大。因?yàn)閜=0.5表示兩種情況出現(xiàn)的概率是相等的。比如一個群體中男生和女生出現(xiàn)的概率都是0.5,說明男女人數(shù)相等。這種情況下,這個群體的性別差異是最大的。
由于總體差異越大,需要的樣本量就越大。我們面對任何總體的時候,都可以假設(shè)“這是一個差異性最大的總體”,來計算我們所需要的樣本量。因此,把p=0.5代入,就簡化出了一個可以供我們輕松計算樣本量的公式。
如果想看到總體不同差異所對應(yīng)的樣本量,前人還總結(jié)了這樣一個表:
資料來源:《社會研究方法》仇立平著,重慶大學(xué)出版社,P137
因此假設(shè)總體差異性最大的情況下,在習(xí)慣使用的5%誤差檔,300多的樣本也就可以了。
當(dāng)然,在具體使用過程中,并不用查表那么麻煩。有一個著名的計算樣本量的網(wǎng)站,直接去算就OK了。
http://www.surveysystem.com/sscalc.htm
首先,總體規(guī)模會對樣本量有影響。當(dāng)總體規(guī)模比較小的時候,對樣本量影響較大。但是當(dāng)總體規(guī)模達(dá)到一定程度以后,對樣本量增加的需求是較小的。
我們往往調(diào)查所涉及到的總體不是無限總體,產(chǎn)品的用戶人數(shù)都是一個有限的數(shù)量。因此在計算所需樣本量的時候,為了更精確可以加入變量“總體規(guī)模”,公式大概長成這個樣子:
然而這不是重點(diǎn),重點(diǎn)是通過這個公式可以計算出,不同總體規(guī)模所需要的樣本量大致如下:
由此可以看出,當(dāng)總體規(guī)模在1萬以下時,隨著總體規(guī)模上升,所需樣本量增加比較大。但是當(dāng)總體規(guī)模在1萬以上時,規(guī)模再變大,所需樣本人數(shù)的增長變得緩慢。
為了得到更準(zhǔn)確的答案,我們不妨用計算樣本量的網(wǎng)址自己來算一下。假設(shè)置信區(qū)間為±3個標(biāo)準(zhǔn)差。計算結(jié)果如下:
如果再有人說:我們是億級的產(chǎn)品,1000人怎么能代表我們的用戶?
就可以理直氣壯的告訴他:
總體規(guī)模10萬以上和10萬所需要的樣本量并沒有什么區(qū)別呢。
樣本量選多少合適,對于調(diào)研本身而言或許不是個問題。但是當(dāng)我們想推動調(diào)研結(jié)果的時候,樣本量卻很容易遭到對方質(zhì)疑。可能是幾百個人的答案看起來容易讓人覺得不靠譜,也可能因?yàn)闃颖玖渴亲钊菀踪|(zhì)疑的一個因素……
無論如何,多了解一些背后的原因,讓自己更有底氣,或許才能更好地說服別人。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04