
思維導(dǎo)圖
Q1:用來(lái)描述隨機(jī)變量的數(shù)字特征有哪些?
1.期望E(X):數(shù)學(xué)期望,用來(lái)表示隨機(jī)變量X的平均水平
-
將X所對(duì)應(yīng)的隨機(jī)試驗(yàn)重復(fù)多次,隨著試驗(yàn)次數(shù)的增加,X的均值μ會(huì)愈發(fā)趨近于E(X)
-
離散型隨機(jī)變量的期望

-
連續(xù)型隨機(jī)變量的期望

2.方差D(X)&標(biāo)準(zhǔn)差σ:方差用來(lái)刻畫隨機(jī)變量X的波動(dòng)大小,方差也記為Var(X)
-
方差越大,結(jié)果的未知性就會(huì)越大
-
方差

定義式

-
標(biāo)準(zhǔn)差

-
標(biāo)準(zhǔn)化變量:數(shù)據(jù)標(biāo)準(zhǔn)化處理的理論依據(jù),以此統(tǒng)一量綱,可以進(jìn)行進(jìn)一步的分析或建模

3.分位數(shù):用來(lái)關(guān)注X中某個(gè)樣本x在整體分布中的排序情況
-
若滿足下式,則t為X的α分位數(shù)

-
若α為0.5,則稱t為隨機(jī)變量X的中位數(shù)

-
樣本的分位數(shù):通常用來(lái)監(jiān)控異常數(shù)據(jù),設(shè)[0.05,0.95]為合理的分位數(shù)區(qū)間,若某一樣本值沒(méi)有處于歷史樣本的該區(qū)間內(nèi),則需要對(duì)其重點(diǎn)排查。如果排查出是異常值,需要進(jìn)行剔除或修正。
4.協(xié)方差Cov(X,Y)&相關(guān)系數(shù)ρ(X,Y):用來(lái)關(guān)注兩個(gè)或多個(gè)隨機(jī)變量之間的關(guān)系
-
聯(lián)合分布

-
獨(dú)立變量:如果滿足下式,則X,Y為相互獨(dú)立的變量

-
協(xié)方差

-
相關(guān)系數(shù):用來(lái)描述X、Y之間是否存在線性關(guān)系

-
當(dāng)X、Y相互獨(dú)立時(shí),協(xié)方差和相關(guān)系數(shù)均為0,反之不成立
-
相關(guān)系數(shù)的絕對(duì)值接近于1時(shí),說(shuō)明二者之間的線性關(guān)系比較強(qiáng)
-
相關(guān)系數(shù)的絕對(duì)值接近于0時(shí),則表示二者之間的線性關(guān)系比較弱
Q2:隨機(jī)變量X+Y、XY的期望與X、Y期望的關(guān)系?
-
對(duì)于任意兩個(gè)隨機(jī)變量X、Y,都滿足

-
對(duì)于獨(dú)立變量X、Y,滿足

第二個(gè)公式是單向的,即若E(XY)=E(X)E(Y),則只能表明X、Y是不相關(guān)的,不能表明X、Y是相互獨(dú)立的??蓞⒖糛4進(jìn)行理解。
Q3:分布的期望和中位數(shù)的大小關(guān)系?
-
分布的期望和中位數(shù)的大小關(guān)系根據(jù)分布的不同而變化
-
正偏態(tài):中位數(shù)小于期望

正偏態(tài)PDF
-
正態(tài):中位數(shù)等于期望

正態(tài)PDF
-
負(fù)偏態(tài):中位數(shù)大于期望

負(fù)偏態(tài)PDF
Q4:簡(jiǎn)述變量獨(dú)立與變量不相關(guān)的區(qū)別
-
不相關(guān):兩者沒(méi)有線性關(guān)系,但是不排除其他的關(guān)系存在
-
獨(dú)立:二者互不相干,沒(méi)有關(guān)聯(lián)
-
例:假設(shè)y=ax^2+b,則X、Y非獨(dú)立但不相關(guān)。

x^2與y之間呈明顯的線性關(guān)系,但是x與y之間不存在線性關(guān)系,相關(guān)系數(shù)的絕對(duì)值接近于0
-
不相關(guān)和獨(dú)立是一種包含關(guān)系

Q5:常見分布的期望和方差是什么?
該問(wèn)題一般不會(huì)在面試中會(huì)被直接問(wèn)到,但是掌握這部分內(nèi)容對(duì)其他部分的學(xué)習(xí)有很大的幫助作用
-
常見離散型隨機(jī)變量的分布律、期望、方差

-
常見連續(xù)型隨機(jī)變量的分布律、期望、方差

參考文獻(xiàn)
1.《拿下Offer 數(shù)據(jù)分析師求職面試指南》徐麟 著