
如何決定樣本量,是一個老生常談的話題,也有很多相關文章。然而翻看相關文章,就會發(fā)現介紹選多少合適的比較多,而介紹為什么這么選就合適的卻比較少。
相信很多用研同學都聽過這句著名的話:
根據尼爾森關于可用性測試的經典理論,6-8人便可以找到產品80%以上的可用性問題。
但是……為啥呢?當有“無知的”地球人問:為什么6-8人就能發(fā)現80%以上的問題時,難道我們要理直氣壯的說:因為是尼爾森說的么……
在樣本量選擇上似乎有一些“約定俗成”的規(guī)定。比如:可用性測試5-8人,問卷調研大約200-500份等等……但是,當需要和地球人理論時,單單的“約定俗成”卻沒有足夠的說服力。不如讓我們一起來看看這些“約定俗成”背后的科學道理,讓自己更有底氣。
俗話說“8個用戶可以發(fā)現80%的問題”。其實這句話并不完整,完整的說法應該是:
8個人可以80%的概率發(fā)現發(fā)生可能性大于18%的問題。
這話太繞了,嘗試用人話解釋一下:如果某個APP中存在一個BUG,100個人用,50個人用都會遇到,那么我們至少有80%的可能性發(fā)現。只要可能遇到的人大于18個(發(fā)生可能性大于18%),我們都至少有80%的可能性發(fā)現。但如果這個BUG只有5個人可會遇到,那么能發(fā)現的概率就要低于80%了。
之所以這么說,背后的原理是這樣一個公式:
(P(X≥1)是在n次嘗試中事件至少發(fā)生1次的概率,p是某事件的概率)
前輩們根據這個公式總結出了下表:
資料來源:《用戶體驗度量》Jeff Sauro,James R.Lewis著,機械工業(yè)出版社,P134-135
從表中可以看出,決定樣本量涉及到兩個因素:一個是確定程度,一個是問題發(fā)生的概率。
再來具體看一看我們常說的“8個人”。
當選擇8個人進行測試時,可以100%發(fā)現發(fā)生概率大于50%的問題,90%的可能性發(fā)現發(fā)生概率大于25%的問題,73%的可能性發(fā)現發(fā)生概率大于15%的問題。
就好像天氣預報員說:100%的確定明天的降水概率大于50%,90%的確定明天的降水概率大于25%。
等等…這樣的話會不會被質疑:8個人只能90%發(fā)現發(fā)生概率大于25%的問題,那發(fā)生概率低于25%的問題怎么辦?就不重要了么?
不如讓我們再來看看尼爾森關于釣魚的比喻:
假設你有好多個池塘可以釣魚,一些魚比另一些魚更容易抓到。所以,如果你有10小時,你會花10個小時都在一個池塘里釣魚,還是花5個小時在一個池塘上、花另外的5個小時在另一個池塘上呢? 為使抓到的魚數量最大化,你應該在兩個池塘上都花一些時間,以便從每個池塘里都釣到容易釣的魚。
一次何必找那么多用戶,少做幾個用戶先把發(fā)生率高的問題get了,版本更新以后再繼續(xù)找用戶去get發(fā)生率高的問題,省時省力效果佳。
這樣是不是就可以完整的證明我們可用性測試做5-8個人的觀點了呢。
在做問卷調研的時候,如何估計樣本量?眾所周知有一個公式:
但是這個公式存在一個問題:我要是連總體方差(CV2)都能知道,還做個毛線調研。
如果想估算總體方差,需要先選取一批人進行測試,得到一個樣本方差,用樣本方差代替總體方差,這在現實工作中顯然難以實現。于是為了便于計算,偉大的前輩對公式進行了轉換:
資料來源:《社會研究方法》仇立平著,重慶大學出版社,P137
作者說這一轉換是根據“推論總體比例或百分比的原理”進行的。姑且不去管這個轉換原理是什么,這個公式我們可以這樣來理解:當p=0.5的時候,總體的差異性最大。因為p=0.5表示兩種情況出現的概率是相等的。比如一個群體中男生和女生出現的概率都是0.5,說明男女人數相等。這種情況下,這個群體的性別差異是最大的。
由于總體差異越大,需要的樣本量就越大。我們面對任何總體的時候,都可以假設“這是一個差異性最大的總體”,來計算我們所需要的樣本量。因此,把p=0.5代入,就簡化出了一個可以供我們輕松計算樣本量的公式。
如果想看到總體不同差異所對應的樣本量,前人還總結了這樣一個表:
資料來源:《社會研究方法》仇立平著,重慶大學出版社,P137
因此假設總體差異性最大的情況下,在習慣使用的5%誤差檔,300多的樣本也就可以了。
當然,在具體使用過程中,并不用查表那么麻煩。有一個著名的計算樣本量的網站,直接去算就OK了。
http://www.surveysystem.com/sscalc.htm
首先,總體規(guī)模會對樣本量有影響。當總體規(guī)模比較小的時候,對樣本量影響較大。但是當總體規(guī)模達到一定程度以后,對樣本量增加的需求是較小的。
我們往往調查所涉及到的總體不是無限總體,產品的用戶人數都是一個有限的數量。因此在計算所需樣本量的時候,為了更精確可以加入變量“總體規(guī)?!保酱蟾砰L成這個樣子:
然而這不是重點,重點是通過這個公式可以計算出,不同總體規(guī)模所需要的樣本量大致如下:
由此可以看出,當總體規(guī)模在1萬以下時,隨著總體規(guī)模上升,所需樣本量增加比較大。但是當總體規(guī)模在1萬以上時,規(guī)模再變大,所需樣本人數的增長變得緩慢。
為了得到更準確的答案,我們不妨用計算樣本量的網址自己來算一下。假設置信區(qū)間為±3個標準差。計算結果如下:
如果再有人說:我們是億級的產品,1000人怎么能代表我們的用戶?
就可以理直氣壯的告訴他:
總體規(guī)模10萬以上和10萬所需要的樣本量并沒有什么區(qū)別呢。
樣本量選多少合適,對于調研本身而言或許不是個問題。但是當我們想推動調研結果的時候,樣本量卻很容易遭到對方質疑??赡苁菐装賯€人的答案看起來容易讓人覺得不靠譜,也可能因為樣本量是最容易質疑的一個因素……
無論如何,多了解一些背后的原因,讓自己更有底氣,或許才能更好地說服別人。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協(xié)同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數據解讀到決策支撐的價值導向 統(tǒng)計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10