數(shù)學(xué)部分-統(tǒng)計(jì)學(xué)

Percentile

計(jì)算百分位數(shù)。PDF P438的例子。

當(dāng)y=(n+1)*p/100 不是整數(shù)時(shí),比如12.5, 那么取第12個(gè)和第13個(gè)數(shù),然后用(v13-v12)(12.5-12)+v12 這樣算。即在兩個(gè)數(shù)之間,又按比例取了一個(gè)數(shù)

注意quitile,quartile這些,不一定是和換算為20,25百分位的數(shù)值完全相等。因?yàn)榘俜治豢赡懿徽?,?分,5分位整除。

Coefficient of variation: 注意這個(gè)是變異系數(shù),不是協(xié)方差。定義是標(biāo)準(zhǔn)差/平均值。比如一組數(shù)較小,一組數(shù)較大,但標(biāo)準(zhǔn)差相同。這兩個(gè)

標(biāo)準(zhǔn)差就無法說明哪組數(shù)的波動(dòng)性更大。但除以平均值后就可以說明了。

切比雪夫不等式:從平均值出發(fā),偏離正負(fù)K個(gè)標(biāo)準(zhǔn)差(K>1)之內(nèi)包含的數(shù)據(jù)點(diǎn)占整個(gè)集合的百分比,不低于1-1/k^2

夏普比率:? (組合收益-無風(fēng)險(xiǎn)收益)/組合收益的標(biāo)準(zhǔn)差。? ?衡量的是每一點(diǎn)風(fēng)險(xiǎn)帶來的超額收益(相對(duì)于無風(fēng)險(xiǎn)收益)

如果沒有無風(fēng)險(xiǎn)收益做參照物,那么就不可比。例如我把標(biāo)準(zhǔn)差弄的很小,但收益也較低,比率仍然可以比較大。有了無風(fēng)險(xiǎn)收益做對(duì)比,大家就被拉到了一個(gè)起跑線上

注意如果夏普比率為負(fù),那么有可能標(biāo)準(zhǔn)差越大,夏普比率越大(往0的方向靠近)。這種情況就不能說夏普比率越大越好。

夏普比率的另一個(gè)應(yīng)用是,他是用標(biāo)準(zhǔn)差衡量風(fēng)險(xiǎn)的。如果有些模型天然就是高頻交易,每次盈利一點(diǎn)點(diǎn),但有可能頻率較低的有大額虧損,可能就不適合

偏度skewness :

sk=(各個(gè)值與均值之差的立方/標(biāo)準(zhǔn)差的立方)/n? (n較大,如>100時(shí).n小時(shí)公式為n/((n-1)(n-2))? )

偏度衡量整個(gè)分布是往左偏還是往右偏。

豐度kurtosis :

kt=(各個(gè)值與均值之差的立方/標(biāo)準(zhǔn)差的立方)/n? (n較大,如>100時(shí).n小時(shí)公式為n(n+1)/((n-1)(n-2)(n-3))? )

相對(duì)豐度:

kt' = kt-3? 3是正態(tài)分布的豐度。這個(gè)值衡量的是相對(duì)于正態(tài)分布的豐度。

豐度較大,意味著fatter tail,表示偏離度可能比較大。一般來說豐度>1就算是比較大了。

有了豐度、偏度基本可以衡量一個(gè)歷史數(shù)據(jù)的偏離度和大部分值落在哪里。



skewness

偏度形容了整個(gè)數(shù)據(jù)集往左偏還是往右偏。

錯(cuò)題的經(jīng)驗(yàn):

1. 讀題不仔細(xì)??辞宄莔ean,median。 看清楚起止日期。

2. 調(diào)和平均數(shù)計(jì)算平均價(jià)格。調(diào)和平均數(shù)

條件概率的理解:


條件概率的定義


聯(lián)合概率,注意這個(gè)公式只有在A和B獨(dú)立的情況下成立


條件概率的定義這樣理解比較好:A和B的概率各是一個(gè)圈。A,B同時(shí)發(fā)生的概率是兩個(gè)圈的交集。要求兩個(gè)圈的交集部分占B圈的面積,就是P(AB)/P(B).? 但這種理解并不好解釋在A和B獨(dú)立的情況

注意如果A和B獨(dú)立,則從上述兩個(gè)公式中可以推出P(A|B)=P(A).? 所以大部分的場(chǎng)景下,考慮條件概率一般是A和B不相互獨(dú)立。

還有一個(gè)公式是:

P(AB) = P(A | B)P(B) ? 是第一個(gè)公式的簡(jiǎn)單變形。

書中P492的例子(A是收益大于無風(fēng)險(xiǎn)收益的概率,0.7, B是收益大于0的概率,0.8)是一種特殊情況。收益大于無風(fēng)險(xiǎn)收益,那么收益肯定是大于0的,所以0.7是一個(gè)P(A&B),符合上述公式。

進(jìn)入數(shù)學(xué)期望部分

前面所討論的是基于樣本的統(tǒng)計(jì),描述了一組數(shù)據(jù)的集中程度、偏離集中點(diǎn)的程度。

數(shù)學(xué)期望則是一種預(yù)期,是一種預(yù)測(cè),不是對(duì)已有數(shù)據(jù)的描述。但做出預(yù)測(cè)的基礎(chǔ)還是已有的一些信息。期望還有另外一種解釋,即樣本在無窮大時(shí)的均值。

已經(jīng)知道了隨機(jī)變量的一些分布信息,比如有p1的概率取值為v1, 有p2的概率取值為v2 ,等等。然后需要給一個(gè)隨機(jī)變量預(yù)測(cè)一個(gè)期望值,就是數(shù)學(xué)期望。

在前面做樣本統(tǒng)計(jì)的時(shí)候,方差被用來描述樣本偏離均值的程度。一個(gè)隨機(jī)變量的方差用下面公式定義:

? ??

隨機(jī)變量X的方差

隨機(jī)變量的方差,被定義為(隨機(jī)變量與數(shù)學(xué)期望的差的平方)的數(shù)學(xué)期望。

(X-E(X))^2? 這個(gè)東西沒有辦法計(jì)算出來。因?yàn)閄是一個(gè)隨機(jī)變量。但這個(gè)東西的數(shù)學(xué)期望卻是可以計(jì)算的,基于已有的信息。如下公式,X1,X2到Xn都代表一個(gè)樣本點(diǎn)(或者說我們估計(jì)的以某個(gè)概率發(fā)生的事件)。P(Xn)代表了樣本點(diǎn)發(fā)生的概率。

所以,上述方差公式展開后就變?yōu)椋?/p>

隨機(jī)變量的方差展開

這個(gè)公式比較重要。



數(shù)學(xué)期望樹

這個(gè)樹比較重要。劃清楚這個(gè)樹對(duì)于整理思路很有幫助。

如果一個(gè)隨機(jī)變量是由幾個(gè)隨機(jī)變量構(gòu)成的,每個(gè)隨機(jī)變量有一定的權(quán)重,這就是投資組合的數(shù)學(xué)模型。

要求組合的數(shù)學(xué)期望,將各組成部分的數(shù)學(xué)期望求出來,然后乘以權(quán)重,再相加就可以了。

對(duì)于一個(gè)組合的方差,是如下公式:Rp代表Return of Portfolio 。

其中w1代表組合中第一個(gè)隨機(jī)變量的權(quán)重,R1代表第一個(gè)隨機(jī)變量。 ??

從這里展開

從而最終推導(dǎo)出:


最終推導(dǎo)結(jié)論

這是一個(gè)比較漂亮的N*N矩陣。對(duì)角線為每個(gè)隨機(jī)變量的方差。其中cov協(xié)方差的定義:


協(xié)方差定義

i==j的時(shí)候,協(xié)方差就是方差。

一般來說,乘積的期望不等于期望的乘積,除非變量相互獨(dú)立。所以協(xié)方差不能理解為E(Ri-ERi) * E(Rj-ERj)

(R-ER) ,有可能是負(fù)的,也有可能是正的,代表了獨(dú)立變量在多大程度上,哪個(gè)方向上對(duì)期望的偏離。

兩個(gè)獨(dú)立變量距離各自期望的偏離之積。而這個(gè)積的期望反應(yīng)的是這個(gè)積在樣本無窮大時(shí),這個(gè)積的值。當(dāng)樣本空間非常大時(shí),這個(gè)積有如下趨勢(shì):

1,如果兩個(gè)獨(dú)立變量不相關(guān)(這里的不相關(guān)指不線性相關(guān))或者獨(dú)立,那么這個(gè)積趨向于0. 因?yàn)闃颖径嗔酥笳?fù)最終要相抵。

2,如果兩個(gè)變量的變化方向相同,那么樣本超多之后,這個(gè)積一定是正的或負(fù)的

協(xié)方差的符號(hào)說明了兩個(gè)變量在變化上的相關(guān)性。其值的大小在一般的數(shù)學(xué)問題上沒有意義,因?yàn)閮蓚€(gè)變量的量綱可能差距較遠(yuǎn)。但在計(jì)算投資回報(bào)時(shí),因?yàn)橥顿Y回報(bào)率都是在-100%到100%波動(dòng),所以其值也衡量了波動(dòng)的大小。

對(duì)于一般的數(shù)學(xué)問題,需要消除掉量綱的影響。消除量綱的方法是協(xié)方差除以每個(gè)變量的標(biāo)準(zhǔn)差,得到一個(gè)東西,這個(gè)東西就是相關(guān)系數(shù):

相關(guān)系數(shù) correlation= Cov(a,b)/(std(a)*std(b))

仍然注意這里的相關(guān)指的是線性相關(guān)。相關(guān)系數(shù)為1代表完全正相關(guān),0代表完全不相關(guān),-1代表完全負(fù)相關(guān)。

兩個(gè)隨機(jī)變量獨(dú)立的定義:P(AB)=P(A)*P(B) 這和前面條件概率的討論是一致的

兩個(gè)隨機(jī)變量不相關(guān)的定義:E(AB)=E(A)E(B) ?


貝葉斯公式:

公式比較簡(jiǎn)單,從條件概率的變形即可得到:

因?yàn)?P(A|B)*P(B)=P(B|A)*P(A)=P(AB)

所以P(A|B)=P(B|A)*P(A)/P(B)

關(guān)鍵是此公式代表的現(xiàn)實(shí)意義和如何使用。當(dāng)A是一個(gè)已知信息,B是新發(fā)生的信息,那么當(dāng)B發(fā)生時(shí),我如何更新A發(fā)生的概率?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容