假設我們要建立一個垃圾郵件分類器:

通過選擇選好的單詞,然后建立一個向量,向量的內容是對應于單詞是否出現(xiàn):

在實際中,我們通過選取詞頻最高的n個單詞作為特征,然后用來做垃圾分類。
獲取數(shù)據(jù),“honeypot” project。
下面有幾種垃圾郵件分類方案:

假設我們要建立一個垃圾郵件分類器:
通過選擇選好的單詞,然后建立一個向量,向量的內容是對應于單詞是否出現(xiàn):
在實際中,我們通過選取詞頻最高的n個單詞作為特征,然后用來做垃圾分類。
獲取數(shù)據(jù),“honeypot” project。
下面有幾種垃圾郵件分類方案: