
Excel數(shù)據(jù)分析:抽樣設計
一、隨機數(shù)發(fā)生器
1. 隨機數(shù)發(fā)生器主要功能
“隨機數(shù)發(fā)生器”分析工具可用幾個分布之一產(chǎn)生的獨立隨機數(shù)來填充某個區(qū)域。可以通過概率分布來表示總體中的主體特征。例如,可以使用正態(tài)分布來表示人體身高的總體特征,或者使用雙值輸出的伯努利分布來表示擲幣實驗結果的總體特征。
2. 隨機數(shù)發(fā)生器對話框簡介
隨機數(shù)發(fā)生器對話框
該對話框中的參數(shù)隨分布的選擇而有所不同,其余均相同。
變量個數(shù):在此輸入輸出表中數(shù)值列的個數(shù)。
隨機數(shù)個數(shù):在此輸入要查看的數(shù)據(jù)點個數(shù)。每一個數(shù)據(jù)點出現(xiàn)在輸出表的一行中。
分布:在此單擊用于創(chuàng)建隨機數(shù)的分布方法。包括以下幾種:均勻分布、正態(tài)分布、伯努利分布、二項式、泊松、模式、離散。
隨機數(shù)基數(shù):在此輸入用來產(chǎn)生隨機數(shù)的可選數(shù)值??稍谝院笾匦率褂迷摂?shù)值來生成相同的隨機數(shù)。
輸出區(qū)域:在此輸入對輸出表左上角單元格的引用。如果輸出表將替換現(xiàn)有數(shù)據(jù),Excel 會自動確定輸出區(qū)域的大小并顯示一條消息。
新工作表:單擊此選項可在當前工作簿中插入新工作表,并從新工作表的 A1 單元格開始粘貼計算結果。若要為新工作表命名,請在框中鍵入名稱。
新工作簿:單擊此選項可創(chuàng)建新工作簿并將結果添加到其中的新工作表中。
3. 隨機數(shù)發(fā)生器應用舉例
3.1 均勻隨機數(shù)的產(chǎn)生
均勻:以下限和上限來表征。其變量是通過對區(qū)域中的所有數(shù)值進行等概率抽取而得到的。普通的應用使用范圍 0 到 1 之間的均勻分布。相當于工作表函數(shù):“= a+RAND()*(b-a)”,與RANDBETWEEN (a,b)”的區(qū)別是,RANDBETWEEN產(chǎn)生的是離散型隨機數(shù),而隨機數(shù)發(fā)生器產(chǎn)生的是連續(xù)型隨機數(shù)。
離散型函數(shù)產(chǎn)生可重復隨機數(shù),若想產(chǎn)生無重復隨機數(shù),應使用連續(xù)型,再從中利用RANK函數(shù)產(chǎn)生整型。通常在進行抽樣設計時要產(chǎn)生無重復的整型均勻隨機數(shù)。
例:在編號為1至20之間隨機抽取10個無重復的均勻隨機數(shù)。
均勻隨機數(shù)對話框
單擊“確定”生成連續(xù)型隨機數(shù)(如圖)。
產(chǎn)生隨機數(shù)
由圖可見,所產(chǎn)生的是連續(xù)型隨機數(shù),若四舍五入取整,在B1單元格輸入公式“=ROUND(A1,0)”,并復制到B1:B10,得到整型隨機數(shù)。
由圖可見,數(shù)字13出現(xiàn)了兩次,為可重復隨機數(shù)。在統(tǒng)計調(diào)查時,不能對同一調(diào)查對象調(diào)查兩次,應產(chǎn)生無重復隨機數(shù)。處理的辦法如下:
在A列對總體進行編號;在B2輸入公式“=RAND()”,生產(chǎn)0至1之間的均勻隨機數(shù),并復制到B3:B21;C列顯示樣本序號;選擇D2:D11單元格區(qū)域,在D2單元格輸入公式“=RANK(B2:B21,B2:B21)”,按住Ctrl+Shift不放再按回車鍵,生成隨機數(shù)。該隨機數(shù)是無重復的。當然也可由VLOOKUP函數(shù)實現(xiàn),所處從略。
無重復隨機數(shù)的產(chǎn)生
3.2 正態(tài)隨機數(shù)的產(chǎn)生
正態(tài)分布描述:
正態(tài):以平均值和標準偏差來表征,相當于工作表函數(shù)“=NORMINV(rand(),mu,sigma)”
例:產(chǎn)生10行8列來自均值為100、標準差為10的總體隨機數(shù)。
隨機數(shù)發(fā)生器選擇“分布”為“正態(tài)”,設置對話框如下:
隨機數(shù)發(fā)生器對話框的正態(tài)分布設置
單擊“確定”生成隨機數(shù)如下:
產(chǎn)生的正態(tài)分布隨機數(shù)
3.3 產(chǎn)生0-1分布隨機數(shù)
伯努利:以給定的試驗中成功的概率(p 值)來表征。伯努利隨機變量的值為 0 或 1。等價于函數(shù):“=IF(RAND())”.
例:產(chǎn)生5列10行的成功概率為0.5的0-1隨機數(shù)。驗證概率的頻率法定義。
隨機數(shù)發(fā)生器“分布”選擇柏努利,設置對話框如下:
0-1隨機數(shù)對話框
單擊“確定”生成隨機數(shù)。
在G列輸入累積的試驗次數(shù);H2輸入公式,統(tǒng)計正態(tài)朝上的次數(shù)(1的個數(shù));I2求得頻率(=H2/G2);將H2:I2復制到H3:I21單元格區(qū)域。
以H列為橫坐標,I列為縱坐標,繪制不帶標志點的折線型散點圖。由圖可見,隨機試驗次數(shù)的增加,頻率逐步趨于0.5
頻率法概率定義的驗證
3.4 產(chǎn)生二項分布隨機數(shù)
二項式:以一系列試驗中成功的概率(p 值)來表征。例如,可以按照試驗次數(shù)生成一系列伯努利隨機變量,這些變量之和為一個二項式隨機變量。
二項分布描述:
二項分布描述
例:某射手中靶的概率為0.8,每次射擊10發(fā)子彈,射擊10次,模擬每次中靶的次數(shù)。
隨機數(shù)發(fā)生器選擇“分布”為“二項”,設置對話框如下:
隨機數(shù)發(fā)生器對話框的二項分布設置
單擊“確定”生成隨機數(shù)如下:
產(chǎn)生的二項分布隨機數(shù)
3.5 產(chǎn)生泊松分布隨機數(shù)
泊松:以值 λ 來表征,λ 等于平均值的倒數(shù)。泊松分布經(jīng)常用于表示單位時間內(nèi)事件發(fā)生的次數(shù),例如,汽車到達收費停車場的平均速率。其描述如下:
泊松分布描述
例:某加油站,平均每小時前來加油的車輛為10輛,試進行100次模擬,并求其分布情況。
隨機數(shù)發(fā)生器選擇“分布”為“泊松”,設置對話框如下:
隨機數(shù)發(fā)生器對話框的泊松分布設置
單擊“確定”生成隨機數(shù)如下:
產(chǎn)生的泊松分布隨機數(shù)
求得最大值,最小值,確定組限,利用frequency函數(shù)統(tǒng)計頻數(shù),并求頻率如下圖。選擇P2:P10單元格區(qū)域,在P2單元格輸入公式“=FREQUENCY(A1:J10,O2:O10)”,同時按ctrl+shift+enter:
頻數(shù)統(tǒng)計
3.6 產(chǎn)生重復序列
模式:以下界和上界、步幅、數(shù)值的重復率和序列的重復率來表征。在生物遺傳學中常用到重復序列。EXCEL的“模式”所產(chǎn)生的重復序列是按相同步長產(chǎn)生的重復序列。
如:下列對話框設置:
重復序列對話框
可產(chǎn)生的重復序列為:112233112233112233
3.7 產(chǎn)生離散隨機數(shù)
離散:以數(shù)值及相應的概率區(qū)域來表征。該區(qū)域必須包含兩列,左邊一列包含數(shù)值,右邊一列為與該行中的數(shù)值相對應的發(fā)生概率。所有概率的和必須為 1。
例如:某商品銷售情況根據(jù)某段時期統(tǒng)計如下(經(jīng)驗分布):
試進行80次模擬。
(1)在A列和B列輸入?yún)?shù)(經(jīng)驗分布)
(2)隨機數(shù)發(fā)生器選擇“離散”,設置如下:
離散分布對話框
(3)單擊確定,在C1:M8產(chǎn)生80個隨機數(shù)。
(4)對產(chǎn)生的隨機數(shù)利用frequency函數(shù)統(tǒng)計頻數(shù),并求頻率(略)。
二、抽樣
“抽樣”分析工具以數(shù)據(jù)源區(qū)域為總體,從而為其創(chuàng)建一個樣本。當總體太大而不能進行處理或繪制時,可以選用具有代表性的樣本。如果確認數(shù)據(jù)源區(qū)域中的數(shù)據(jù)是周期性的,還可以僅對一個周期中特定時間段中的數(shù)值進行采樣。例如,如果數(shù)據(jù)源區(qū)域包含季度銷售量數(shù)據(jù),則以四為周期進行采樣,將在輸出區(qū)域中生成與數(shù)據(jù)源區(qū)域中相同季度的數(shù)值。
1.隨機抽樣
(1)打開一張工作表,輸入總體編號或總體標志值(本例A2:J11單元格區(qū)域,使用“填充”-“序列”可以快速生成該區(qū)域)。
隨機抽樣
(2)抽樣對話框設置:
隨機抽樣對話框設置
單擊“確定”生成隨機樣本。注意,該樣本是可重復抽樣,重復率與總體單位數(shù)成反比,與樣本量成正比。
2.周期抽樣
例:從1至10編號按固定周期間隔分別為2、3、4、5抽樣。
周期抽樣對話框設置
單擊“確定”抽得樣本(D列),取間隔依次取3、4、5,輸出區(qū)域依次改為E2、F2、G2,得隨機數(shù)如圖。
周期抽取的樣本
該種抽樣類似等距抽樣,但不同的是統(tǒng)計學中的等距抽樣是在第1組進行簡單隨機抽樣,以后的樣本等于首樣本位置依次加組距的k倍。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03