面試

1.說(shuō)一下大數(shù)定理?

1.通俗地說(shuō),在試驗(yàn)不變的條件下,重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它的概率。偶然中包含著必然。

2.不同的大數(shù)定理主要討論在一下不同條件下,隨機(jī)變量序列的算術(shù)平均依概率收斂到其均值的算術(shù)平均。

微信截圖_20190909142330.png

3.大數(shù)定律總的講,有伯努利大數(shù)定律,切比雪夫大數(shù)定律,馬爾科夫大數(shù)定律,辛欽大數(shù)定律

其中

  • 伯努利大數(shù)定理:是講在n次伯努利實(shí)驗(yàn)中也就是獨(dú)立同分布的情況下。

  • 切比雪夫大數(shù)定律是:設(shè){X_n}為一列兩兩不相關(guān)的隨機(jī)變量序列,若每個(gè)X_i的方差存在,且有共同的上界,

    伯努利大數(shù)定律是切比雪夫大數(shù)定律的特殊情況。

  • 馬兒科夫大數(shù)定律:隨機(jī)變量序列滿足
    微信截圖_20190909182022.png

    的情況下,不要求獨(dú)立,不要求滿足同分布。

  • 辛欽大數(shù)定律:獨(dú)立同分布的隨機(jī)序列,若存在數(shù)學(xué)期望

2.說(shuō)一下中心極限定理?

1.中心極限定理討論隨機(jī)變量序列部分和分布漸近于正態(tài)分布的一類定理

2.中心極限定理主要有獨(dú)立同分布下的正態(tài)近似、二項(xiàng)分布的正態(tài)近似、獨(dú)立不同分布下的正態(tài)近似

3.卡方分布是什么?

  • 定義:n個(gè)獨(dú)立同分布標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量,這n個(gè)隨機(jī)變量平方和的分布稱為自由度為n的卡方分布。

    卡方分布也就是伽馬分布的特例,是n個(gè)獨(dú)立伽馬分布和的分布

  • 密度函數(shù):
    微信截圖_20190909184731.png
  • 圖像:
    微信截圖_20190909184825.png
  • 性質(zhì):
    微信截圖_20190909185304.png
  • 分位數(shù):
    微信截圖_20190909185847.png
  • 例子:
    微信截圖_20190909190132.png

4.t分布是什么

微信截圖_20190909153635.png
微信截圖_20190909153819.png

微信截圖_20190909191025.png
  • 定義:
  • 密度函數(shù)
  • 圖像:對(duì)稱
  • 性質(zhì):趨近正態(tài)分布
  • 分位數(shù):

5.F分布是什么?

微信截圖_20190909153546.png

-- 密度函數(shù):
微信截圖_20190909191450.png
微信截圖_20190909191535.png
微信截圖_20190909191605.png
  • 性質(zhì):
    • F分布的倒數(shù)還是F分布
  • 分位數(shù):
  • 微信截圖_20190909192038.png

6.一些推論?

微信截圖_20190909192519.png
微信截圖_20190909193023.png
微信截圖_20190909193232.png
微信截圖_20190909193642.png
微信截圖_20190909194547.png
微信截圖_20190909194722.png
微信截圖_20190909194842.png
微信截圖_20190909195001.png

微信截圖_20190909195202.png

7.AB test

  • 什么是ABtest

    答:將Web或App界面或流程的兩個(gè)或多個(gè)版本,在同一時(shí)間維度,分別組成成分相同(相似)的訪客群組訪問(wèn),收集各群組的用戶體驗(yàn)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),最后分析評(píng)估出最好版本正式采用。

    AB測(cè)試強(qiáng)調(diào)的是同一時(shí)間維度對(duì)相似屬性分組用戶的測(cè)試,時(shí)間的統(tǒng)一性有效的規(guī)避了因?yàn)闀r(shí)間、季節(jié)等因素帶來(lái)的影響,而屬性的相似性則使得地域、性別、年齡等等其他因素對(duì)效果統(tǒng)計(jì)的影響降至最低

  • abtest 流程

    AB測(cè)試是一個(gè)反復(fù)迭代優(yōu)化的過(guò)程,它的基本步驟如下圖所示可以劃分為:

    1.設(shè)定項(xiàng)目目標(biāo)即AB測(cè)試的目標(biāo)

    2.設(shè)計(jì)優(yōu)化的迭代開發(fā)方案,完成新模塊的開發(fā)

    3.確定實(shí)施的版本以及每個(gè)線上測(cè)試版本的分流比例

    4.按照分流比例開放線上流量進(jìn)行測(cè)試(要保證實(shí)驗(yàn)的有效性,要確定分流是否已經(jīng)到達(dá)所需要的最小樣本量)

    5.收集實(shí)驗(yàn)數(shù)據(jù)進(jìn)行有效性和效果判斷

    6.根據(jù)試驗(yàn)結(jié)果確定發(fā)布新版本、調(diào)整分流比例繼續(xù)測(cè)試或者在試驗(yàn)效果未達(dá)成的情況下繼續(xù)優(yōu)化迭代方案重新開發(fā)上線試驗(yàn)

  • abtest的注意事項(xiàng)

    • 用戶的有效分組以及如何判斷實(shí)驗(yàn)中不同分組用戶屬性的相似性

    • 試驗(yàn)過(guò)程中如何收集用戶的體驗(yàn)和業(yè)務(wù)數(shù)據(jù),如何對(duì)收集的數(shù)據(jù)進(jìn)行分析并判斷不同版本間的優(yōu)劣

    • 影響用戶決策的新產(chǎn)品上線和其他具有風(fēng)險(xiǎn)性的功能上線通常采用先從小流量測(cè)試開始,然后逐步放大測(cè)試流量的方法。但是,測(cè)試版本的流量如果太小又可能造成隨機(jī)結(jié)果的引入,試驗(yàn)結(jié)果失去統(tǒng)計(jì)意義。

    • 為了規(guī)避樣本量帶來(lái)的不足我們可以:

      1.試驗(yàn)設(shè)計(jì)時(shí)預(yù)估進(jìn)入試驗(yàn)的樣本量,做分流規(guī)劃時(shí)避免分配給測(cè)試集的樣本量過(guò)少。

      2.除了進(jìn)行AB測(cè)試外增加關(guān)于數(shù)據(jù)有效性考量的AA測(cè)試,將原始版本的流量中分出兩個(gè)和測(cè)試版本相同的流量也進(jìn)入測(cè)試。例如:為測(cè)試一個(gè)新的功能,我們?cè)緶?zhǔn)備劃分90%流量給老版本,10%流量給新版本;這時(shí)我們可以分配70%流量給老版本A,同時(shí)生成兩個(gè)10%流量的老版本C和D進(jìn)行AA測(cè)試,然后把剩余的10%流量給新版本B;在試驗(yàn)過(guò)程中通過(guò)考察分配給老版本C和D的兩股流量是否存在顯著性差異,從而認(rèn)定試驗(yàn)分流是否有效。

      3.如果參與測(cè)試新版本已經(jīng)分配了很大的流量比例,但是仍然存在樣本量不足的情況,這時(shí)就只能通過(guò)拉長(zhǎng)試驗(yàn)時(shí)間的方式來(lái)累積足夠的樣本量進(jìn)行比較了。需要參考用戶的行為周期。

    • 多層次正交的實(shí)驗(yàn)方式使多個(gè)并發(fā)實(shí)驗(yàn)都可以保證具備一定流量的并行進(jìn)行

  • 假設(shè)檢驗(yàn)流程

    • 建立假設(shè)(常將沒(méi)有充分理由不能否定的命題作為原假設(shè))
    • 選擇檢驗(yàn)統(tǒng)計(jì)量
    • 選擇顯著性水平\alpha
    • 計(jì)算拒絕域或是計(jì)算P值
    • 得出結(jié)論
  • 假設(shè)檢驗(yàn)的原理:小概率原理

  • 兩類錯(cuò)誤:

    • 第一類錯(cuò)誤(拒真錯(cuò)誤、顯著性水平):H_0為真,但是由于隨機(jī)性,統(tǒng)計(jì)檢驗(yàn)量落在了拒絕域內(nèi)
    • 第二類錯(cuò)誤(取偽錯(cuò)誤):H_0為假,但是由于隨機(jī)性,統(tǒng)計(jì)檢驗(yàn)量落在了接收域內(nèi)。
    • 兩者的大小是相對(duì)的,一個(gè)減小勢(shì)必導(dǎo)致另一個(gè)增加。所以要在適當(dāng)控制拒真錯(cuò)誤中制約取偽錯(cuò)誤。
  • 檢驗(yàn)P值:

    利用樣本觀測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱為檢驗(yàn)P值
  • 勢(shì)函數(shù)或者功效函數(shù)

    樣本觀測(cè)值落在拒絕域內(nèi)的概率稱為該檢驗(yàn)的勢(shì)函數(shù)。

  • 假設(shè)檢驗(yàn)的分類

    • 單個(gè)正態(tài)總體均值的檢驗(yàn)
      • 方差已知時(shí)的檢驗(yàn)

        微信截圖_20190909225442.png
      • 方差未知時(shí)的檢驗(yàn)

        微信截圖_20190909225459.png

    兩個(gè)正態(tài)總體均值差的檢驗(yàn)

    • 方差已知的檢驗(yàn)
微信截圖_20190909225542.png
  • 方差相等但是未知的檢驗(yàn)
微信截圖_20190909225554.png
  • 單個(gè)正態(tài)總體方差的卡方檢驗(yàn)

    微信截圖_20190909225913.png
微信截圖_20190909225925.png
  • 兩個(gè)正態(tài)總體方差的F檢驗(yàn)
![微信截圖_20190909230021.png](https://upload-images.jianshu.io/upload_images/10558298-676c219f09da36e8.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • https://mp.weixin.qq.com/s/BuHiG9FjX-OiSNWx3KquQQ 17.隨機(jī)梯度...
    _龍雀閱讀 4,017評(píng)論 0 4
  • SQL題: 表 Cost: date | cname(customer's name) | cost找出每天花費(fèi)最...
    無(wú)敵的肉包閱讀 10,472評(píng)論 0 41
  • 1、問(wèn):你在測(cè)試中發(fā)現(xiàn)了一個(gè)bug,但是開發(fā)經(jīng)理認(rèn)為這不是一個(gè)bug,你應(yīng)該怎樣解決? 首先,將問(wèn)題提交到缺陷管理...
    小灰輝先生閱讀 1,404評(píng)論 0 3
  • 包含的重點(diǎn)內(nèi)容:JAVA基礎(chǔ)JVM 知識(shí)開源框架知識(shí)操作系統(tǒng)多線程TCP 與 HTTP架構(gòu)設(shè)計(jì)與分布式算法數(shù)據(jù)庫(kù)知...
    消失er閱讀 4,549評(píng)論 1 10
  • 1****、問(wèn):你在測(cè)試中發(fā)現(xiàn)了一個(gè)bug****,但是開發(fā)經(jīng)理認(rèn)為這不是一個(gè)bug****,你應(yīng)該怎樣解決?首先...
    一箭閱讀 9,199評(píng)論 1 205

友情鏈接更多精彩內(nèi)容