Percentile

計(jì)算百分位數(shù)。PDF P438的例子。

當(dāng)y=(n+1)*p/100 不是整數(shù)時(shí)，比如12.5，那么取第12個(gè)和第13個(gè)數(shù)，然后用(v13-v12)(12.5-12)+v12 這樣算。即在兩個(gè)數(shù)之間，又按比例取了一個(gè)數(shù)

注意quitile，quartile這些，不一定是和換算為20,25百分位的數(shù)值完全相等。因?yàn)榘俜治豢赡懿徽?，?分，5分位整除。

Coefficient of variation: 注意這個(gè)是變異系數(shù)，不是協(xié)方差。定義是標(biāo)準(zhǔn)差/平均值。比如一組數(shù)較小，一組數(shù)較大，但標(biāo)準(zhǔn)差相同。這兩個(gè)

標(biāo)準(zhǔn)差就無法說明哪組數(shù)的波動(dòng)性更大。但除以平均值后就可以說明了。

切比雪夫不等式：從平均值出發(fā)，偏離正負(fù)K個(gè)標(biāo)準(zhǔn)差（K>1)之內(nèi)包含的數(shù)據(jù)點(diǎn)占整個(gè)集合的百分比，不低于1-1/k^2

夏普比率：? (組合收益-無風(fēng)險(xiǎn)收益)/組合收益的標(biāo)準(zhǔn)差。? ?衡量的是每一點(diǎn)風(fēng)險(xiǎn)帶來的超額收益（相對(duì)于無風(fēng)險(xiǎn)收益）

如果沒有無風(fēng)險(xiǎn)收益做參照物，那么就不可比。例如我把標(biāo)準(zhǔn)差弄的很小，但收益也較低，比率仍然可以比較大。有了無風(fēng)險(xiǎn)收益做對(duì)比，大家就被拉到了一個(gè)起跑線上

注意如果夏普比率為負(fù)，那么有可能標(biāo)準(zhǔn)差越大，夏普比率越大（往0的方向靠近）。這種情況就不能說夏普比率越大越好。

夏普比率的另一個(gè)應(yīng)用是，他是用標(biāo)準(zhǔn)差衡量風(fēng)險(xiǎn)的。如果有些模型天然就是高頻交易，每次盈利一點(diǎn)點(diǎn)，但有可能頻率較低的有大額虧損，可能就不適合

偏度skewness :

sk=（各個(gè)值與均值之差的立方/標(biāo)準(zhǔn)差的立方）/n? （n較大，如>100時(shí).n小時(shí)公式為n/((n-1)(n-2))? )

偏度衡量整個(gè)分布是往左偏還是往右偏。

豐度kurtosis :

kt=（各個(gè)值與均值之差的立方/標(biāo)準(zhǔn)差的立方）/n? （n較大，如>100時(shí).n小時(shí)公式為n(n+1)/((n-1)(n-2)(n-3))? )

相對(duì)豐度：

kt' = kt-3? 3是正態(tài)分布的豐度。這個(gè)值衡量的是相對(duì)于正態(tài)分布的豐度。

豐度較大，意味著fatter tail，表示偏離度可能比較大。一般來說豐度>1就算是比較大了。

有了豐度、偏度基本可以衡量一個(gè)歷史數(shù)據(jù)的偏離度和大部分值落在哪里。

skewness

偏度形容了整個(gè)數(shù)據(jù)集往左偏還是往右偏。

錯(cuò)題的經(jīng)驗(yàn)：

1. 讀題不仔細(xì)?？辞宄莔ean，median。看清楚起止日期。

2. 調(diào)和平均數(shù)計(jì)算平均價(jià)格。調(diào)和平均數(shù)

條件概率的理解：

條件概率的定義

聯(lián)合概率，注意這個(gè)公式只有在A和B獨(dú)立的情況下成立

條件概率的定義這樣理解比較好:A和B的概率各是一個(gè)圈。A,B同時(shí)發(fā)生的概率是兩個(gè)圈的交集。要求兩個(gè)圈的交集部分占B圈的面積，就是P(AB)/P(B).? 但這種理解并不好解釋在A和B獨(dú)立的情況

注意如果A和B獨(dú)立，則從上述兩個(gè)公式中可以推出P(A|B)=P(A).? 所以大部分的場(chǎng)景下，考慮條件概率一般是A和B不相互獨(dú)立。

還有一個(gè)公式是：

P(AB) = P(A | B)P(B) ? 是第一個(gè)公式的簡(jiǎn)單變形。

書中P492的例子(A是收益大于無風(fēng)險(xiǎn)收益的概率，0.7， B是收益大于0的概率，0.8）是一種特殊情況。收益大于無風(fēng)險(xiǎn)收益，那么收益肯定是大于0的，所以0.7是一個(gè)P(A&B)，符合上述公式。

進(jìn)入數(shù)學(xué)期望部分

前面所討論的是基于樣本的統(tǒng)計(jì)，描述了一組數(shù)據(jù)的集中程度、偏離集中點(diǎn)的程度。

數(shù)學(xué)期望則是一種預(yù)期，是一種預(yù)測(cè)，不是對(duì)已有數(shù)據(jù)的描述。但做出預(yù)測(cè)的基礎(chǔ)還是已有的一些信息。期望還有另外一種解釋，即樣本在無窮大時(shí)的均值。

已經(jīng)知道了隨機(jī)變量的一些分布信息，比如有p1的概率取值為v1, 有p2的概率取值為v2 ，等等。然后需要給一個(gè)隨機(jī)變量預(yù)測(cè)一個(gè)期望值，就是數(shù)學(xué)期望。

在前面做樣本統(tǒng)計(jì)的時(shí)候，方差被用來描述樣本偏離均值的程度。一個(gè)隨機(jī)變量的方差用下面公式定義：

? ??

隨機(jī)變量X的方差

隨機(jī)變量的方差，被定義為（隨機(jī)變量與數(shù)學(xué)期望的差的平方）的數(shù)學(xué)期望。

(X-E(X))^2? 這個(gè)東西沒有辦法計(jì)算出來。因?yàn)閄是一個(gè)隨機(jī)變量。但這個(gè)東西的數(shù)學(xué)期望卻是可以計(jì)算的，基于已有的信息。如下公式，X1,X2到Xn都代表一個(gè)樣本點(diǎn)（或者說我們估計(jì)的以某個(gè)概率發(fā)生的事件）。P(Xn)代表了樣本點(diǎn)發(fā)生的概率。

所以，上述方差公式展開后就變?yōu)椋?/p>

隨機(jī)變量的方差展開

這個(gè)公式比較重要。

數(shù)學(xué)期望樹

這個(gè)樹比較重要。劃清楚這個(gè)樹對(duì)于整理思路很有幫助。

如果一個(gè)隨機(jī)變量是由幾個(gè)隨機(jī)變量構(gòu)成的，每個(gè)隨機(jī)變量有一定的權(quán)重，這就是投資組合的數(shù)學(xué)模型。

要求組合的數(shù)學(xué)期望，將各組成部分的數(shù)學(xué)期望求出來，然后乘以權(quán)重，再相加就可以了。

對(duì)于一個(gè)組合的方差，是如下公式：Rp代表Return of Portfolio 。

其中w1代表組合中第一個(gè)隨機(jī)變量的權(quán)重，R1代表第一個(gè)隨機(jī)變量。 ??

從這里展開

從而最終推導(dǎo)出：

最終推導(dǎo)結(jié)論

這是一個(gè)比較漂亮的N*N矩陣。對(duì)角線為每個(gè)隨機(jī)變量的方差。其中cov協(xié)方差的定義：

協(xié)方差定義

i==j的時(shí)候，協(xié)方差就是方差。

一般來說，乘積的期望不等于期望的乘積，除非變量相互獨(dú)立。所以協(xié)方差不能理解為E(Ri-ERi) * E(Rj-ERj)

（R-ER) ，有可能是負(fù)的，也有可能是正的，代表了獨(dú)立變量在多大程度上，哪個(gè)方向上對(duì)期望的偏離。

兩個(gè)獨(dú)立變量距離各自期望的偏離之積。而這個(gè)積的期望反應(yīng)的是這個(gè)積在樣本無窮大時(shí)，這個(gè)積的值。當(dāng)樣本空間非常大時(shí)，這個(gè)積有如下趨勢(shì)：

1，如果兩個(gè)獨(dú)立變量不相關(guān)（這里的不相關(guān)指不線性相關(guān)）或者獨(dú)立，那么這個(gè)積趨向于0. 因?yàn)闃颖径嗔酥笳?fù)最終要相抵。

2，如果兩個(gè)變量的變化方向相同，那么樣本超多之后，這個(gè)積一定是正的或負(fù)的

協(xié)方差的符號(hào)說明了兩個(gè)變量在變化上的相關(guān)性。其值的大小在一般的數(shù)學(xué)問題上沒有意義，因?yàn)閮蓚€(gè)變量的量綱可能差距較遠(yuǎn)。但在計(jì)算投資回報(bào)時(shí)，因?yàn)橥顿Y回報(bào)率都是在-100%到100%波動(dòng)，所以其值也衡量了波動(dòng)的大小。

對(duì)于一般的數(shù)學(xué)問題，需要消除掉量綱的影響。消除量綱的方法是協(xié)方差除以每個(gè)變量的標(biāo)準(zhǔn)差，得到一個(gè)東西，這個(gè)東西就是相關(guān)系數(shù)：

相關(guān)系數(shù) correlation= Cov(a,b)/(std(a)*std(b))

仍然注意這里的相關(guān)指的是線性相關(guān)。相關(guān)系數(shù)為1代表完全正相關(guān)，0代表完全不相關(guān)，-1代表完全負(fù)相關(guān)。

兩個(gè)隨機(jī)變量獨(dú)立的定義：P(AB)=P(A)*P(B) 這和前面條件概率的討論是一致的

兩個(gè)隨機(jī)變量不相關(guān)的定義：E(AB)=E(A)E(B) ?

貝葉斯公式：

公式比較簡(jiǎn)單，從條件概率的變形即可得到：

因?yàn)?P(A|B)*P(B)=P(B|A)*P(A)=P(AB)

所以P(A|B)=P(B|A)*P(A)/P(B)

關(guān)鍵是此公式代表的現(xiàn)實(shí)意義和如何使用。當(dāng)A是一個(gè)已知信息，B是新發(fā)生的信息，那么當(dāng)B發(fā)生時(shí)，我如何更新A發(fā)生的概率？

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

數(shù)學(xué)部分-統(tǒng)計(jì)學(xué)

數(shù)學(xué)部分-統(tǒng)計(jì)學(xué)

進(jìn)入數(shù)學(xué)期望部分

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

數(shù)學(xué)部分-統(tǒng)計(jì)學(xué)

進(jìn)入數(shù)學(xué)期望部分

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av