計(jì)算機(jī)科學(xué)與Python編程導(dǎo)論 第16/18/19/20章

一、基本概念

1)蒙特卡羅模擬

蒙特卡羅模擬用于求事件的近似概率,它多次執(zhí)行同一模擬,然后將結(jié)果進(jìn)行平均。

2)投資回報(bào)率公式定義:


投資回報(bào)率

3)性能出現(xiàn)問(wèn)題時(shí),經(jīng)常會(huì)采用查表法。查表法是以空間換時(shí)間這種通用思想的一個(gè)典型例子。散列表越大,碰撞就越少,平均查找時(shí)間就越少。

4)擬合指數(shù)分布數(shù)據(jù)

polyfit使用線性回歸找出一個(gè)給定階數(shù)的多項(xiàng)式,作為特定數(shù)據(jù)的最優(yōu)最小二乘擬合。如果數(shù)據(jù)可以直接由多項(xiàng)式進(jìn)行近似,那么這種方法效果很好。

將現(xiàn)有數(shù)據(jù)劃分為訓(xùn)練集和保留集,保留集將來(lái)會(huì)作為測(cè)試集使用,然后再進(jìn)行一系列實(shí)驗(yàn)。不考慮保留集,我們先建立一個(gè)可以解釋訓(xùn)練集的模型。多數(shù)情況下,相對(duì)于保留集,這種模型會(huì)對(duì)訓(xùn)練集擬合得更好。但如果這個(gè)模型的確很好,那么它對(duì)保留集也應(yīng)該擬合得很好,否則這個(gè)模型就應(yīng)該被丟棄。

交叉驗(yàn)證:使用從原始數(shù)據(jù)中隨機(jī)選擇的多個(gè)子集來(lái)訓(xùn)練模型,然后檢查這些模型彼此之間的相似程度。如果這些模型非常相似,就說(shuō)明模型是令人滿意的。

5)P值

P值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法所得到的P 值,一般以P < 0.05 為有統(tǒng)計(jì)學(xué)差異, P<0.01 為有顯著統(tǒng)計(jì)學(xué)差異,P<0.001為有極其顯著的統(tǒng)計(jì)學(xué)差異。其含義是樣本間的差異由抽樣誤差所致的概率小于0.05 、0.01、0.001。實(shí)際上,P值不能賦予數(shù)據(jù)任何重要性,只能說(shuō)明某事件發(fā)生的幾率。統(tǒng)計(jì)結(jié)果中顯示Pr > F,也可寫(xiě)成Pr( >F),P = P{ F0.05 > F}或P = P{ F0.01 > F}。

6)顯著性檢驗(yàn)

顯著性檢驗(yàn)(significance test)就是事先對(duì)總體(隨機(jī)變量)的參數(shù)或總體分布形式做出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷這個(gè)假設(shè)(備擇假設(shè))是否合理,即判斷總體的真實(shí)情況與原假設(shè)是否有顯著性差異?;蛘哒f(shuō),顯著性檢驗(yàn)要判斷樣本與我們對(duì)總體所做的假設(shè)之間的差異是純屬機(jī)會(huì)變異,還是由我們所做的假設(shè)與總體真實(shí)情況之間不一致所引起的。 顯著性檢驗(yàn)是針對(duì)我們對(duì)總體所做的假設(shè)做檢驗(yàn),其原理就是“小概率事件實(shí)際不可能性原理”來(lái)接受或否定假設(shè)。

eg:雙樣本的t檢驗(yàn),參考學(xué)習(xí)下列鏈接:

基于python的顯著性檢驗(yàn) - 簡(jiǎn)書(shū)

7)條件概率

定義?如果A和B是兩個(gè)事件,且P(B)≠0。那么B條件下,A的條件概率為:

條件概率公式

8)貝葉斯統(tǒng)計(jì)

聯(lián)合概率可交換,即 P(A and B)=P(B and A)

對(duì)于任意事件A、B都獨(dú)立,因此聯(lián)合概率P(A and B)=P(B)P(A|B)

兩步驟執(zhí)行交換,即P(B and A)=P(A)P(B|A)

因?yàn)椴襟E1等式,有如下等式成立P(B)P(A|B)=P(A)P(B|A)

最后等式兩端除以P(B),得到P(A|B)=P(A)P(B|A)/P(B)


二、練習(xí)

1)模擬一個(gè)雙股兒游戲

雙股兒游戲

2)用Python實(shí)現(xiàn)的一個(gè)簡(jiǎn)單的貝葉斯的腳本

首先定義Bayes類(lèi),初始化創(chuàng)建一個(gè)dict類(lèi)型的容器container。該容器是為了儲(chǔ)存貝葉斯各項(xiàng)信息。key鍵存儲(chǔ)假設(shè),value值存儲(chǔ)概率Set方法是給容器添加先驗(yàn)假設(shè)及先驗(yàn)概率Mult方法:根據(jù)key查找到先驗(yàn)概率,并更新概率。Normalize方法:歸一化。Prob方法:返回某一事件的概率

實(shí)現(xiàn)貝葉斯的腳本簡(jiǎn)單案例

3)

正態(tài)分布.png

4)

非正態(tài)分布&非均勻分布
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容