【R】二項(xiàng)分布函數(shù)

二項(xiàng)分布函數(shù)

二項(xiàng)分布指的是:N重伯努利實(shí)驗(yàn),記為X \sim b(n,p),E(x)=np,Var(x)=np(1-p)

dbinom(x, size, prob)   #計(jì)算每個(gè)點(diǎn)的概率密度分布
pbinom(x, size, prob)   #計(jì)算事件的累積概率(表示概率的單個(gè)值) 
qbinom(p, size, prob)   #獲取概率值, 并生成一個(gè)其累加值與概率值匹配的數(shù)字。
rbinom(n, size, prob)   #用于從給定樣本中為給定概率生成所需數(shù)量的隨機(jī)值//產(chǎn)生n個(gè)b(size, prob)的二項(xiàng)分布隨機(jī)數(shù)
parameter description
x 數(shù)字的向量
p 概率向量
n 觀察的數(shù)量
size 試驗(yàn)的數(shù)量
prob 每個(gè)試驗(yàn)成功的概率

dbinom():計(jì)算二項(xiàng)式分布的概率(PDF)

  • dfunction()==對(duì)于離散分布來(lái)說(shuō)結(jié)果是特定值的概率,對(duì)連續(xù)變量來(lái)說(shuō)是密度==
    • 連續(xù)分布概率密度函數(shù)某個(gè)點(diǎn)對(duì)應(yīng)的值表示的是概率密度(也就是分布函數(shù)的導(dǎo)數(shù)),而不是概率
  • 概率密度函數(shù)(PDF)
    • 連續(xù)型隨機(jī)變量的概率密度函數(shù)是一個(gè)描述這個(gè)隨機(jī)變量的輸出值,在某個(gè)確定的取值點(diǎn)附近的可能性的函數(shù)。
    • 而隨機(jī)變量的取值落在某個(gè)區(qū)域之內(nèi)的概率則為概率密度函數(shù)在這個(gè)區(qū)域上的積分(CDF)
    • 概率密度函數(shù)就是只我們想要求面積時(shí)候的那個(gè)圖形的表達(dá)式(Link
    • 如:翻硬幣的例子,假如翻正面概率0.4,反面0.6,則這個(gè)模型的PDF就是{0.4, 0.6}
'''
某種疫苗注射后過(guò)敏反應(yīng)的概率是0.08,問(wèn)某社區(qū)衛(wèi)生院在接種該疫苗100人后,少于3人有過(guò)敏反應(yīng)的概率是多少?
P(X<3)=P(X=0)+P(X=1)+P(X=2)
'''
print(dbinom(0,100,0.08)+dbinom(1,100,0.08)+dbinom(2,100,0.08))  # 點(diǎn)密度

# 或 print(pbinom(2, 100, 0.08)) # 區(qū)域密度
>>>
0.0112728

pbinom():計(jì)算特定二項(xiàng)式分布的累積分布函數(shù)(CDF)

  • pbinom(8, 20, 0.2)指第8次伯努利實(shí)驗(yàn)的累計(jì)概率
    • 其中總試驗(yàn)次數(shù)size = 20,每次實(shí)驗(yàn)成功發(fā)生的概率 prob = 0.2
  • 累積分布函數(shù)(CDF)/ 分布函數(shù)
    • 概率密度函數(shù)(PDF)的積分,能完整描述一個(gè)實(shí)隨機(jī)變量X的概率分布。
    • CDF函數(shù)表示隨機(jī)變量小于或等于其某一個(gè)取值x的概率
    • 對(duì)連續(xù)函數(shù),所有小于等于a的值,其出現(xiàn)概率的和。F(a)=P(x<=a)
    • 應(yīng)用:
      • 對(duì)小于參考值的現(xiàn)象值的出現(xiàn)頻率的分析的累積頻率分析
      • 對(duì)累計(jì)分布函數(shù)進(jìn)行估計(jì),隨后可以求得簡(jiǎn)單的統(tǒng)計(jì)值,或進(jìn)行各種統(tǒng)計(jì)假設(shè)檢驗(yàn)
# Probability of getting 20 or fewer heads from 48 tosses of a coin.
x <- pbinom(20, 48, 0.5)  #數(shù)字向量,試驗(yàn)次數(shù),成功概率

#Showing output
print(x)

>>>
0.1561634

qbinom():計(jì)算二項(xiàng)式分布的逆累積分布函數(shù)

quantile function 分位數(shù)函數(shù)

  • 分位數(shù)
    • 若概率 0 < p < 1,隨機(jī)變量 X 或 它的 概率分布的分位數(shù) Za。是指滿足條件p(X>Za) = α的實(shí)數(shù)。
    • 如t分布的分位數(shù)表,自由度 f = 20α = 0.05 時(shí)的分位數(shù)為1.7247。 --這個(gè)定義指的是 上側(cè) α 分位數(shù)
  • \alpha 分位數(shù)
    • 實(shí)數(shù)\alpha 滿足 0 <\alpha <1 時(shí),\alpha 分位數(shù)是使P{X< xα}=F(xα)=α的數(shù)xα
    • 雙側(cè)\alpha分位數(shù)是使P{X<λ1}=F(λ1)=0.5α 的數(shù)λ1、使 P{X>λ2}=1-F(λ2)=0.5α的數(shù)λ2。
  • qbinom是上側(cè)分位數(shù)
    • qbinom(0.95,100,0.2)=27,指27之后P(x>=27)>=0.95
    • 即對(duì)于b(100,0.2)為了達(dá)到0.95的概率至少需要27次重復(fù)實(shí)驗(yàn)。
# Finding number of heads with the  help of qbinom() function 
x <- qbinom(0.45, 48, 0.5)

#Showing output
print(x)

>>>
24

rbinom(): 生成二項(xiàng)分布隨機(jī)數(shù)

產(chǎn)生n個(gè)b(size, prob)的二項(xiàng)分布隨機(jī)數(shù)

  • rbinom(n, size, prob)
    • n表示生成的隨機(jī)數(shù)的數(shù)量
    • size表示進(jìn)行伯努利試驗(yàn)的次數(shù)
    • prob表示一次伯努利試驗(yàn)成功的概率。
  • 注意:在rbinom()函數(shù)中,n可以大于size,比如rbinom(100,10,.5)。
'''
以拋硬幣為例,總共拋硬幣100次(size=100),得到正面記為成功,即每次成功概率為0.5(prob=0.5)
'''
rbinom(30,100,.5)   #小數(shù)點(diǎn)前的0可以省略
>>>
生成的30個(gè)隨機(jī)數(shù)都在50左右徘徊。
因?yàn)槊看尾囼?yàn)(拋硬幣)的成功概率是0.5,
那么在理想狀態(tài)下,模擬100次伯努利試驗(yàn)(拋100次硬幣),成功的次數(shù)應(yīng)為50次,
由此可見(jiàn),在函數(shù)rbinom()中,結(jié)果的含義是伯努利試驗(yàn)成功的次數(shù)。
image
  • 模擬伯努利試驗(yàn)的次數(shù)減少,n值的偏差將會(huì)變大
rbinom(10,10,.5)
>>>
在本例中,單次試驗(yàn)的成功概率依舊為0.5,
但是只模擬10次試驗(yàn),并生成10個(gè)隨機(jī)數(shù),最大的數(shù)為8,遠(yuǎn)遠(yuǎn)偏離預(yù)期的5。
image
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容