單解釋變量的回歸分析
利用最小二乘法求得的表示幾個(gè)變量指標(biāo)之前趨勢(shì)的直線被稱為回歸直線
利用最小二乘法求回歸直線,需要將解釋變量實(shí)際值帶入回歸方程的求出推測(cè)結(jié)果,使實(shí)際結(jié)果和推測(cè)結(jié)果差的平方和最小化。
這樣我們可以發(fā)現(xiàn)訪問次數(shù)每增加一次,平均能多簽0.75份合同這一趨勢(shì)。
在回歸分析中最重要的是發(fā)現(xiàn)解釋變量增加一個(gè)單位時(shí)outcome增長(zhǎng)或減少多少,而表示outcome增加或者減少的“斜率”被稱為回歸系數(shù)
這個(gè)趨勢(shì)僅是根據(jù)3個(gè)數(shù)據(jù)計(jì)算得來的,是可能存在偶然性的。如果有1個(gè)數(shù)據(jù)發(fā)生變化,回歸系數(shù)就會(huì)有較大幅度改變。所以我們還要考慮回歸系數(shù)的標(biāo)準(zhǔn)誤差。我們需要根據(jù)有限且分散的數(shù)據(jù)來分析求得的回歸系數(shù),推測(cè)其與真實(shí)回歸系數(shù)有多大程度的偏差。
在使用z檢驗(yàn)時(shí),平均值的標(biāo)準(zhǔn)誤差是用“與平均值之差的平方”來計(jì)算出的,稱為偏差平方和,偏差平方和除以數(shù)據(jù)量就是方差。而計(jì)算回歸系數(shù)的標(biāo)準(zhǔn)誤差所使用的是“outcome的預(yù)測(cè)值與實(shí)際值之差的平方和”,稱為殘差平方和,殘差平方和除以數(shù)據(jù)量所得的值叫作均方。
由于數(shù)據(jù)量較小,應(yīng)該用t分布來精準(zhǔn)的計(jì)算標(biāo)準(zhǔn)誤差和置信區(qū)間,本例中置信區(qū)間為-4.75~6.25,p值為0.33,也就是說這種這種趨勢(shì)每3次就會(huì)偶然出現(xiàn)一次。
多解釋變量的回歸分析
尋找單個(gè)解釋變量與outcome之間的關(guān)聯(lián)性的回歸分析被稱為一元回歸分析,但很多時(shí)候影響最終結(jié)果的變量不止一個(gè)。在變量遺漏、誤讀關(guān)聯(lián)性就會(huì)直接影響趨勢(shì)預(yù)測(cè)。
比如這樣一組數(shù)據(jù),在散點(diǎn)圖階段看不出有什么趨勢(shì),根據(jù)數(shù)據(jù)求回歸方程得到y(tǒng)=3,也就是說拜訪次數(shù)和簽約數(shù)沒有關(guān)系。但是如果我們又增加另一個(gè)維度的變量就不一樣了,可以清晰的看到隨著拜訪次數(shù)增加,簽約數(shù)量是有增加趨勢(shì)的,并且女生需要更少的拜訪就能簽約更多客戶。
在有多個(gè)解釋變量共同影響結(jié)果時(shí),讓他可視化時(shí)發(fā)現(xiàn)趨勢(shì)的一個(gè)好方法,但也有可能遺漏某些變量。
亞組分析時(shí)處理多變量的一種方法,根據(jù)亞組分析可以按照幾個(gè)a解釋變量為一組劃分?jǐn)?shù)據(jù)(每一組都稱為一個(gè)亞組),可以每個(gè)亞組中訪問次數(shù)與簽約數(shù)的關(guān)系。亞組分析的方法非常簡(jiǎn)單,但是也存在局限,在當(dāng)數(shù)據(jù)中包含的項(xiàng)目較多時(shí),就需要查看大量的分析結(jié)果。
多元回歸分析突破了亞組分析的局限,能夠同時(shí)分析多個(gè)解釋變量與outcome的關(guān)聯(lián)性。多元回歸可以將每組都畫上“平行的回歸直線”,這兩個(gè)直線間的距離就反映了男女在訪問次數(shù)相同時(shí),簽約數(shù)有多大的不同。
如果我們忽略性別,只考慮訪問次數(shù)與簽約數(shù)的關(guān)聯(lián)性,假設(shè)所有的都是女生進(jìn)行拜訪,那么會(huì)得到拜訪4次和5次的時(shí)候,簽約數(shù)會(huì)按照藍(lán)線的趨勢(shì)進(jìn)行分布。
多元回歸首先是要找到核心解釋變量和outcome的關(guān)系,然后從數(shù)值上推測(cè)亞組之間有多大差別,最后調(diào)整亞組的數(shù)字尋找正確的關(guān)聯(lián)性。
小結(jié)
?比起z檢驗(yàn)、t檢驗(yàn)、一元回歸分析這樣的基本方法,若實(shí)務(wù)中可能的解釋變量很多,可以先用所有的解釋變量進(jìn)行多元回歸分析,再尋找p值較?。╬值小意味著偶然的概率更小)且回歸系數(shù)較大(回歸系數(shù)較大意味著對(duì)最終結(jié)果的影響較大)的解釋變量,基于此定位到能定量描述解釋變量和outcome變量趨勢(shì)的回歸系數(shù),發(fā)現(xiàn)創(chuàng)造新利潤(rùn)的思路。