2018-12-24監(jiān)管式 vs. 無監(jiān)管式學習

預測模型中的算法通??梢苑譃閮深悾杭幢O(jiān)管式模型算法和非監(jiān)管式模型算法。在監(jiān)管式模型算法中,控制變量為目標變量,其輸出值是基于數(shù)據(jù)整體而實現(xiàn)的。而輸出的這一變量可作為任務發(fā)起問題的答案,在監(jiān)管式學習的模型邏輯下,這一輸出值在模型的運作過程中很可能是未知的。監(jiān)管式學習模型也被稱之為預測性模型。而在主流的預測性算法模型中,經(jīng)典的分類又包括絕對性的目標變量或者漸進式的目標變量。


需要進行目標決策的例子包括:顧客對于商品購買的決策、對商品購買數(shù)量的決策以及判斷一樁交易的真實性決策、是否需要進入電影院進行消費的決策、兩個捐獻人進行捐贈的間隔日期決策、貸款是否需要違約的決策或者判斷一件產(chǎn)品是否具有市場前景的預測。如果在一份記錄中目標變量沒有足夠多的具有相關(guān)性的數(shù)據(jù)進行支持,那么模型將無法成立。


無監(jiān)管式學習有時候也被稱之為描述性模型,這一過程無需目標變量。在建模過程中,數(shù)據(jù)經(jīng)分析后按照相關(guān)性被歸入不同的數(shù)組。其中每一個數(shù)組都會分配一個標簽對其進行描述。在諸如客戶分析這樣的應用案例中,無監(jiān)管式學習也通常被稱為割裂學習,因為模型在發(fā)揮功能的過程中對數(shù)據(jù)進行了不同維度的割裂和標簽分組。


進行監(jiān)管式學習的關(guān)鍵在于,模型的輸入值是已知的,但是應用變量的應用環(huán)境是未經(jīng)調(diào)查甚至是不可知的。在這些模型中常見的目標變量可能是一個事件、一項決策或者是先于觀測出現(xiàn)的一些行為。應答模型、交叉模型以及增銷模型均是采用這種原理進行工作的:即通過對輸入客戶類群的一些已知值,從而判斷他們有可能在將來購買某一種特殊產(chǎn)品的可能性。


一些有關(guān)于應用性算法的定義偏重于算法功能方面,例如對未來事件或是未來行為的預測。這一記錄的模式通常是一個案例,但是算法本身并不是一個案例。而目標變量實際上可以看作是一個未知值,例如一個缺失值。比如一個納稅人如果沒有提交前一年的收入,那么在這種情況下也可以利用預測模型基于其他已知的相關(guān)證據(jù)對稅務收入這一缺失值進行預測。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容