1.分類VS回歸
????????分類模型VS回歸模型,最根本的不同:前者是預(yù)測一個標(biāo)簽(類型、類別);后者則是預(yù)測一個量。
????????換一個角度來看,分類模型輸出的預(yù)測值是離散值;而回歸模型輸出的預(yù)測值則是連續(xù)值。也就是說輸入一個樣本給模型,回歸模型給出的預(yù)測結(jié)果是在某個值域(一般是實數(shù)域或其子集)上的任意值;而分類模型則是給出特定的某幾個離散值之一。
2.貝葉斯定理
貝葉斯公式如下:
????????用語言解釋就是:在 B 出現(xiàn)的前提下 A 出現(xiàn)的概率,等于 A 和 B 都出現(xiàn)的概率除以 B 出現(xiàn)的概率。
一般化的貝葉斯公式
????????更一般化的情況,假設(shè)事件 本身又包含多種可能性,即
是一個集合:
,那么對于集合中任意的
,貝葉斯定理可用下式表示:
連續(xù)概率的貝葉斯定理的形式為(下面所說的A和B對應(yīng)之前貝葉斯公式中的A與B):
????????其中,是給定
時,
的后驗分布;
則是A的先驗分布概率函數(shù)。
????????為了方便起見,這里的 f 在這些專有名詞中代表不同的函數(shù)。
3.樸素貝葉斯分類器(Na?ve Bayes Classifier)
????????“樸素貝葉斯”(Na?ve Bayes)既可以是一種算法——樸素貝葉斯算法,也可以是一種模型——樸素貝葉斯分類模型(分類器)。
樸素貝葉斯算法
????????首先講作為算法的 Na?ve Bayes,樸素貝葉斯算法可以直接利用貝葉斯定理來實現(xiàn)。先來看簡潔版的貝葉斯定理:
????????在之前的幾個例子中,為了便于理解,當(dāng) B 作為 A 的條件出現(xiàn)時,我們假定它總共只有一個特征。但在實際應(yīng)用中,很少有一件事只受一個特征影響的情況,往往影響一件事的因素有多個。假設(shè),影響的因素有
個,分別是
。
????????則可以寫為:
????????的先驗概率
和多個因素的聯(lián)合概率
都是可以單獨計算的,與
和
之間的關(guān)系無關(guān),因此這兩項都可以被看作常數(shù)。
????????對于求解在,最關(guān)鍵的是
。根據(jù)鏈?zhǔn)椒▌t可得:
????????上面的求解過程,看起來好復(fù)雜,但是,如果從到
這些特征之間,在概率分布上是條件獨立的,也就是說每個特征
與其他特征都不相關(guān)。
????????那么,當(dāng)時,有
——無關(guān)條件被排除到條件概率之外。因此,當(dāng)
中每個特征與其他
個特征都不相關(guān)時,就有:
????????注意此處的z對應(yīng)。
一款極簡單的樸素貝葉斯分類器
????????上式中的到
是特征(Feature),而
則是最終的類別(Class),所以,換一個寫法:
????????這個公式也就是我們的樸素貝葉斯分類器的模型函數(shù)!
????????它用來做預(yù)測時是這樣的:
- 有一個樸素貝葉斯分類模型(器),它能夠區(qū)分出
個類
,用來分類的特征有
個:
。
- 現(xiàn)在有個樣本s,我們要用NB分類器對它做預(yù)測,則需要先提取出這個樣本的所有特征值
和
,將其帶入到下式中進行
次運算:
- 然后比較這
次的結(jié)果,選出使得運算結(jié)果達到最大值的那個
——這個
對應(yīng)的類別就是預(yù)測值。
????????假設(shè)我們當(dāng)前有一個模型,總共只有兩個類別:和
;有三個Feature:
,
和
。
有兩種可能性取值:
和
;
有三種可能性取值:
、
、
;
也有兩種可能性取值:
、
。
????????那么對于這個模型,我們要做的就是通過訓(xùn)練過程,獲得下面這些值:
????????把這些概率值都算出來以后,就可以用來做預(yù)測了。
????????比如我們有一個需要預(yù)測的樣本 X,它的特征值分別是、
、
,那么
樣本被分為
的概率是:
樣本被分為
的概率是:
????????兩者都算出來以后,只需要對比和
誰更大,那么這個樣本的預(yù)測值就是對應(yīng)類別。