Introduction部分
這本書向你解釋了怎樣讓機(jī)器學(xué)習(xí)模型可解釋,這章中包含了一些數(shù)學(xué)公式,但是即使沒(méi)有這些公式,你也應(yīng)該能夠理解這些方法的思想。這本書并不適合于初學(xué)機(jī)器學(xué)習(xí)的同學(xué),如果你是初學(xué)者,建議你去看下面這些內(nèi)容,
書“The Elements of Statistical Learning” by Hastie, Tibshirani, and Friedman (2009) 1
視頻 Andrew Ng’s “Machine Learning” online course on the online learning platform coursera.com to start with machine learning.
以上資源都是免費(fèi)的!
解釋機(jī)器學(xué)習(xí)模型的新方法以極快的速度發(fā)表。要跟上所有發(fā)表的文章是根本不可能。這就是為什么你在這本書中找不到最新穎、最奇特的方法,而是機(jī)器學(xué)習(xí)可解釋性的既定方法和基本概念。這些基礎(chǔ)知識(shí)可以幫助您理解機(jī)器學(xué)習(xí)模型。將基本概念了解明白,可以幫助您更好地理解和評(píng)估自您開(kāi)始閱讀本書以來(lái)最近5分鐘內(nèi)在arxiv.org上發(fā)表的關(guān)于可解釋性的任何新論文(我可能夸大了發(fā)表速度)。
這本書以一些(反烏托邦的)短篇故事開(kāi)始,這些故事對(duì)理解這本書沒(méi)用,但希望能博你一笑,讓你思考。然后,這本書探討了機(jī)器學(xué)習(xí)的概念,可解釋性。我們將討論什么時(shí)候可解釋性是重要的,以及有哪些不同類型的解釋。貫穿全書的術(shù)語(yǔ)可以在1.3 teminology中查閱。大部分的模型和方法都是 3.Dataset章節(jié)中描述的真實(shí)數(shù)據(jù)來(lái)說(shuō)明的。使機(jī)器學(xué)習(xí)可解釋的一種方法是使用可解釋的模型,如線性模型或決策樹。另一種選擇是使用模型無(wú)關(guān)的解釋工具,這些工具可以應(yīng)用于任何有監(jiān)督的機(jī)器學(xué)習(xí)模型。4.Model-Agnostic模型無(wú)關(guān)方法一章討論了部分依賴圖和特征重要性排列等方法。模型無(wú)關(guān)的方法通過(guò)改變機(jī)器學(xué)習(xí)模型的輸入,然后觀察預(yù)測(cè)的結(jié)果變化來(lái)實(shí)現(xiàn)模型的可解釋性。在6.Example Based Explanations一章中討論了一些關(guān)于可解釋性的例子。所有與模型無(wú)關(guān)的方法都可以根據(jù)它們是解釋跨所有數(shù)據(jù)實(shí)例的全局模型還是解釋單個(gè)預(yù)測(cè)來(lái)進(jìn)一步區(qū)分。以下方法解釋了模型的整體行為: 局部依賴圖, 累積的局部效應(yīng), 特征交互, 特征重要性, 全局代理模型 and Prototypes and Criticisms. 為了解釋單個(gè)預(yù)測(cè),我們有 局部代理模型, Shapley值解釋, 反事實(shí)解釋 (以及緊密相關(guān)的: (對(duì)抗性示例)).一些方法可以用來(lái)解釋全局模型行為和個(gè)體預(yù)測(cè)的兩個(gè)方面: 個(gè)體條件期望 和影響實(shí)例.
這本書以對(duì)可解釋機(jī)器學(xué)習(xí)的未來(lái)的樂(lè)觀展望作為結(jié)尾。