
R語言:分布函數(shù)與概率密度+隨機數(shù)產(chǎn)生
1、常見概率分布
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
##正態(tài)分布
pnorm(1.96) #P(x<=1.96)時的分布概率
pnorm(1.96,0,1) #上同
pnorm(1.96,lower.tail = F) #P(x>1.96)注意與pnorm的區(qū)別
qnorm(0.975) #已知分布概率求x值
dnorm(0) #f(0)概率密度值
rnorm(111) #產(chǎn)生符合正態(tài)分布的111個隨機數(shù)
##泊松分布 Possion(x,λ)
dpois(2,0.9) #等同概率密度
dpois(2.1,0.9) #x一定需要整數(shù)
ppois(2.1,0.9) #分布概率,取2.1的最小整數(shù)
其他一些分布函數(shù):
一個利用概率分布解決問題的例子
1. 某人進行射擊,每次擊中目標的命中率為0.02,獨立射擊400次,求至少擊中兩次的概率。
解:400重伯努利試驗,用二項分布求解。
P{X = k} = C400k * (0.02)^k * (0.0=98)^(400-k)
P{X≥2} = 1 – P{X = 0} - P{X = 1}
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
> 1 - sum(pbinom(0:1, 400, 0.02))
[1] 0.9968561
2、根據(jù)分布產(chǎn)生隨機數(shù)
均勻分布、正態(tài)分布是比較常見的產(chǎn)生隨機數(shù)的分布
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
> runif(10)
[1] 0.961465376 0.007521925 0.193619234 0.137027246 0.739370654 0.072907082
[7] 0.674551635 0.650777811 0.984664183 0.796723066
顯著性水平為5%的正態(tài)分布的雙側臨界值是:
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
> qnorm(0.025)
[1] -1.959964
> qnorm(0.975)
[1] 1.959964
隨機數(shù)中產(chǎn)生的問題
問:set.seed設置了種子,但是每次產(chǎn)生的隨機數(shù)還是不同?
解答:set.seed()只對運行該命令后的第一次隨機產(chǎn)生結果有效。
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
> set.seed(13)
> rnorm(10)
[1] 0.5543269 -0.2802719 1.7751634 0.1873201 1.1425261 0.4155261
[7] 1.2295066 0.2366797 -0.3653828 1.1051443
> set.seed(13)
> rnorm(10)
[1] 0.5543269 -0.2802719 1.7751634 0.1873201 1.1425261 0.4155261
[7] 1.2295066 0.2366797 -0.3653828 1.1051443
>
要得到相同的隨機數(shù),還得再“重寫”一遍
set seed(123)
rnorm()
這樣,每次得到的隨機數(shù)就一樣。
——————————————————————————————————
應用一:rep()和replicate()批量取隨機數(shù)
問題:假設我想從符合正態(tài)分布的數(shù)據(jù)集中隨機抽取2個數(shù)據(jù),排序, 這樣的數(shù)據(jù)我需要10對,你會怎么做?
很多人都會想到用rep()這個函數(shù),我們來試試。
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
rep(sort(sample(rnorm(n=100,mean = 0,sd = 1),2)),10)
結果文件:
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
> rep(sort(sample(rnorm(n=100,mean = 0,sd = 1),2)),10)
[1] 0.1188322 0.3224045 0.1188322 0.3224045 0.1188322 0.3224045 0.1188322
[8] 0.3224045 0.1188322 0.3224045 0.1188322 0.3224045 0.1188322 0.3224045
[15] 0.1188322 0.3224045 0.1188322 0.3224045 0.1188322 0.3224045
很明顯不符合我們的要求。
該怎么解決呢?
replicate()函數(shù)可以實現(xiàn),具體如下:
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
replicate(n=10,expr=sort(sample(rnorm(n=100,mean = 0,sd = 1),2)))
結果文件:
[plain] view plain copy
print?在CODE上查看代碼片派生到我的代碼片
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.72719296 -0.9876203 -2.212692 -0.8753055 0.2981434 -1.2255357
[2,] -0.02896154 0.9458406 1.511990 1.9813026 1.2695440 -0.2565482
[,7] [,8] [,9] [,10]
[1,] -0.21979065 -0.6226580 -0.2889041 0.566944
[2,] 0.09309426 0.4599596 0.5187426 1.602581
大家應該注意到:rep()返回的是向量,replicate()返回的是矩陣。
下面列出兩個函數(shù)的用法:
rep():
rep(x, ...)
rep.int(x, times) #每個元素重復次數(shù)
rep_len(x, length.out) #生成向量長度
replicate(),replicate(n, expr, simplify = "array") #隨機數(shù)生成器
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03