在上次推文中我們介紹了幾種可解釋機(jī)器學(xué)習(xí)算法的常見方法，包括置換特征重要性、偏依賴圖和個(gè)體條件期望及其實(shí)現(xiàn)。本次我們將繼續(xù)介紹其他的用來解釋機(jī)器學(xué)習(xí)算法的方法。

1.特征交互（Feature interactions）

1.1介紹

在機(jī)器學(xué)習(xí)中，F(xiàn)eature Interactions（特征交互）是指不同特征之間的相互作用或聯(lián)合效應(yīng)。特征交互可以幫助我們更好地理解數(shù)據(jù)，發(fā)現(xiàn)特征之間的復(fù)雜關(guān)系，以及提高機(jī)器學(xué)習(xí)模型的性能。當(dāng)預(yù)測模型中的特征之間存在交互作用時(shí)，特征對(duì)預(yù)測結(jié)果的影響不是簡單的加和，而是更為復(fù)雜。在現(xiàn)實(shí)生活中，大多數(shù)特征與某些響應(yīng)變量之間的關(guān)系都是復(fù)雜的，包括交互作用。這也是為什么更復(fù)雜的算法（尤其是基于樹的算法）往往表現(xiàn)得非常好的原因——它們的復(fù)雜性通常能夠自然地捕捉復(fù)雜的交互作用。然而，識(shí)別和理解這些交互作用較為困難的。

估計(jì)交互作用強(qiáng)度的一種方法是衡量預(yù)測結(jié)果的變化有多少取決于特征之間的交互作用。這種衡量稱為H統(tǒng)計(jì)量，由Friedman、Popescu等人在2008年提出。

特征交互通常在以下兩個(gè)方面進(jìn)行考慮：

特征之間的組合效應(yīng)：某些特征組合在一起可能具有比它們單獨(dú)使用更強(qiáng)的預(yù)測能力。例如，對(duì)于預(yù)測房價(jià)的問題，房屋的面積和地理位置可能單獨(dú)對(duì)房價(jià)的預(yù)測有一定的影響，但將它們組合在一起可能會(huì)得到更準(zhǔn)確的預(yù)測結(jié)果。
特征之間的相互作用：某些特征之間可能存在非線性相互作用，即它們的組合效果不是簡單的加和關(guān)系。例如，對(duì)于預(yù)測用戶購買行為的問題，用戶的年齡和購買頻率可能存在相互作用，即不同年齡段的用戶在購買頻率上表現(xiàn)不同。

1.2實(shí)施

目前，H統(tǒng)計(jì)量的計(jì)算僅可以通過iml包實(shí)現(xiàn)。我們可以使用Interaction$new()來計(jì)算單向交互作用，以評(píng)估兩個(gè)特定特征在模型中如何相互作用，并且強(qiáng)度如何。

不幸的是，由于算法的復(fù)雜性，H統(tǒng)計(jì)量需要進(jìn)行2n^2次運(yùn)行，因此計(jì)算非常耗時(shí)。例如，計(jì)算單向交互作用的H統(tǒng)計(jì)量需要花費(fèi)兩個(gè)小時(shí)的時(shí)間！在這種情況下，我們可以通過在iml包中減少grid.size或使用parallel = TRUE進(jìn)行并行計(jì)算來加速計(jì)算。
這里為了示例，小編僅使用示例數(shù)據(jù)中的幾個(gè)特征演示一下這一部分（運(yùn)行時(shí)間真的太長了，所以就只選幾個(gè)變量）

# 加載依賴包
library(dplyr)      #數(shù)據(jù)操縱
library(ggplot2)    # 可視化

# Modeling packages
library(h2o)       # H2O
library(recipes)   # 機(jī)器學(xué)習(xí)藍(lán)圖
library(rsample)   # 數(shù)據(jù)分割
library(xgboost)   # 擬合GBM模型

# 模型可解釋性包
library(pdp)       # 偏依賴圖及ICE曲線繪制
library(vip)       # 變量重要性VIP圖
library(iml)       # 普遍IML相關(guān)函數(shù)
library(DALEX)     # 普遍IML相關(guān)函數(shù)
# devtools::install_github('thomasp85/lime')
library(lime)      # 局部可解釋模型無關(guān)解釋
load("inputdata.Rda")#加載示例數(shù)據(jù)
inputdata<-inputdata[,-1]
inputdata$Event<-factor(inputdata$Event,levels = c(0,1),labels = c("Alive","Death"))#結(jié)局變量因子化
set.seed(123)  # 設(shè)置隨機(jī)種子保證可重復(fù)性
split <- initial_split(inputdata, strata = "Event")#數(shù)據(jù)分割
data_train <- training(split)
data_test <- testing(split)

我們這里按照Interaction {iml}示例，使用示例數(shù)據(jù)擬合一個(gè)分類任務(wù)的CART算法

library("rpart")
set.seed(42)
data<-data_train[,1:10]
rf<-rpart(Event~.,data=data)
mod <- Predictor$new(rf, data =data, type = "prob")

# For some models we have to specify additional arguments for the
# predict function
ia <- Interaction$new(mod)

接下來我們對(duì)交互作用降序排列

ia$results %>% 
  arrange(desc(.interaction)) %>% 
  head()
# .feature .class .interaction
# 1:  AADACP1  Death    0.6121357
# 2:  AADACP1  Alive    0.6121357
# 3:     AAAS  Alive    0.6038541
# 4:     AAAS  Death    0.6038541
# 5:    AAGAB  Alive    0.5892189
# 6:    AAGAB  Death    0.5892189

可以進(jìn)一步使用plot函數(shù)將結(jié)果可視化出來

plot(ia)

在確定了具有最強(qiáng)交互作用的變量后，我們可以計(jì)算h統(tǒng)計(jì)量，以確定它主要與哪些特征存在交互作用。我們可以看到AAGAB和AADAT之間有較強(qiáng)的交互作用。

interact_2way <- Interaction$new(mod, feature = "AAGAB")
interact_2way$results %>% 
  arrange(desc(.interaction)) %>% 
  top_n(10)
Selecting by .interaction
# .feature .class .interaction
# 1:   AADAT:AAGAB  Alive    0.4992814
# 2:   AADAT:AAGAB  Death    0.4992814
# 3:    AACS:AAGAB  Death    0.2733772
# 4:    AACS:AAGAB  Alive    0.2733772
# 5: AADACP1:AAGAB  Alive    0.2707731
# 6: AADACP1:AAGAB  Death    0.2707731
# 7:    AAAS:AAGAB  Death    0.2669400
# 8:    AAAS:AAGAB  Alive    0.2669400
# 9:     A2M:AAGAB  Alive    0.1190083
# 10:     A2M:AAGAB  Death    0.1190083

識(shí)別這些交互作用可以幫助我們了解它們與響應(yīng)變量的關(guān)系。我們可以使用PDPs或ICE曲線來觀察交互作用對(duì)預(yù)測結(jié)果的影響。我們可以看下上面步驟發(fā)現(xiàn)的兩個(gè)交互作用比較強(qiáng)的變量如何影響結(jié)局事件的預(yù)測。

# Two-way PDP using iml
interaction_pdp <- Partial$new(
  mod, 
  c("AAGAB", "AADAT"), 
  ice = FALSE, 
  grid.size = 20
) 
plot(interaction_pdp)

1.3其他可供選擇方法

顯然，計(jì)算時(shí)間是確定潛在交互效應(yīng)的主要限制因素，因?yàn)檫@個(gè)過程會(huì)花費(fèi)很長的計(jì)算時(shí)間。盡管 H 統(tǒng)計(jì)量是檢測交互作用的方法中最具統(tǒng)計(jì)學(xué)意義的方法，但還有其他選擇。在Brandon M Greenwell, Boehmke和McCarthy (2018)中討論的基于PDP的變量重要性測量也可以用于量化潛在交互效應(yīng)的強(qiáng)度，可以通過vip::vint()實(shí)現(xiàn)。

2.局部可解釋模型無關(guān)解釋（Local interpretable model-agnostic explanations）

2.1介紹

機(jī)器學(xué)習(xí)中的局部可解釋模型無關(guān)解釋（Local Interpretable Model-Agnostic Explanations，LIME）是一種用于解釋機(jī)器學(xué)習(xí)模型預(yù)測的方法。LIME的目標(biāo)是在特定樣本附近構(gòu)建一個(gè)局部線性模型來近似原始模型的預(yù)測結(jié)果，并解釋該局部模型的系數(shù)以得到對(duì)預(yù)測的解釋。

LIME的基本思想是通過生成一組“虛擬樣本”，這些虛擬樣本是原始樣本在特征空間中的近似，然后利用這些虛擬樣本來訓(xùn)練一個(gè)局部線性模型。在構(gòu)建局部模型時(shí)，LIME使用一種稱為“稀疏線性模型”的方法，這是一種可以解釋性較好的線性模型。通過解釋稀疏線性模型的系數(shù)，我們可以得到對(duì)預(yù)測的解釋，即哪些特征對(duì)于模型的預(yù)測起到了關(guān)鍵作用。

LIME的優(yōu)點(diǎn)是可以應(yīng)用于任何類型的機(jī)器學(xué)習(xí)模型，而不僅限于特定類型的模型。它還可以在不需要訪問原始模型的內(nèi)部結(jié)構(gòu)的情況下解釋模型的預(yù)測結(jié)果，因此被稱為“模型無關(guān)”的解釋方法。

然而，LIME也有一些局限性。首先，由于LIME是在局部構(gòu)建模型，所以解釋的可信度可能會(huì)受到局部數(shù)據(jù)分布的影響。其次，LIME的解釋是基于稀疏線性模型的，可能會(huì)丟失一些復(fù)雜模型的細(xì)節(jié)。因此，在使用LIME時(shí)，需要仔細(xì)考慮其解釋的適用范圍和可信度。

LIME所應(yīng)用的一般算法如下：

對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行置換以創(chuàng)建復(fù)制的特征數(shù)據(jù)，這些數(shù)據(jù)的值可能有輕微修改。
計(jì)算感興趣觀測值與每個(gè)置換觀測值之間的接近度度量（例如，1 - 距離）。
使用選定的機(jī)器學(xué)習(xí)模型預(yù)測置換數(shù)據(jù)的結(jié)局。
選擇 m 個(gè)特征來最好地描述預(yù)測結(jié)果。
對(duì)置換數(shù)據(jù)擬合一個(gè)簡單模型，用 m 個(gè)特征來解釋復(fù)雜模型的結(jié)局，并根據(jù)其與原始觀測值的相似性進(jìn)行加權(quán)。
使用得到的特征權(quán)重來解釋局部行為。

2.2實(shí)施

以上過程可以通過lime包實(shí)現(xiàn)，主要涉及兩個(gè)過程：lime::lime()和lime::explain()。lime::lime()函數(shù)用于創(chuàng)建一個(gè)"explainer"對(duì)象，它是一個(gè)包含已擬合的機(jī)器學(xué)習(xí)模型和訓(xùn)練數(shù)據(jù)特征分布的列表。其中包含的特征分布包括每個(gè)分類變量水平和每個(gè)連續(xù)變量分為n個(gè)箱子（當(dāng)前默認(rèn)為四個(gè)箱子）的分布統(tǒng)計(jì)。這些特征屬性將用于對(duì)數(shù)據(jù)進(jìn)行置換。
首先我們根據(jù)前面的堆疊算法先生成一個(gè)堆疊模型

#訓(xùn)練一個(gè)堆疊模型（見機(jī)器學(xué)習(xí)系列堆疊算法）
ensemble_tree <- h2o.stackedEnsemble(
  x = X, y = Y, training_frame = train_h2o, model_id = "my_tree_ensemble",
  base_models = list(best_glm, best_rf, best_gbm,best_nb,best_nn),
  metalearner_algorithm = "drf"
)

接著提取特征

features<-data_train%>%select(-Event)

使用lime函數(shù)基于堆疊算法模型和特征創(chuàng)建一個(gè)解釋器

# Create explainer object
components_lime <- lime(
  x = features,
  model = ensemble_tree, 
  n_bins = 10
)

class(components_lime)
## [1] "data_frame_explainer" "explainer"            "list"
# Length Class            Mode     
# model                  1    H2OBinomialModel S4       
# preprocess             1    -none-           function 
# bin_continuous         1    -none-           logical  
# n_bins                 1    -none-           numeric  
# quantile_bins          1    -none-           logical  
# use_density            1    -none-           logical  
# feature_type         101    -none-           character
# bin_cuts             101    -none-           list     
# feature_distribution 101    -none-           list

然后我們在驗(yàn)證集數(shù)據(jù)中選擇兩個(gè)對(duì)象，基于他們的特征來解釋模型

lime_explanation <- lime::explain(
  x =data_new, 
  explainer = components_lime, 
  n_permutations = 5000,
  dist_fun = "gower",
  kernel_width = 0.25,
  n_labels = 2,
  n_features = 10, 
  feature_select = "highest_weights"
)

lime::explain（）函數(shù)的主要參數(shù)及意義如下：

x：要為其創(chuàng)建局部解釋的觀察值。
explainer：采用由lime::lime()創(chuàng)建的解釋器對(duì)象，將用于創(chuàng)建置換數(shù)據(jù)。置換是從lime::lime()解釋器對(duì)象創(chuàng)建的變量分布中采樣得到的。
n_permutations：為x中的每個(gè)觀察值創(chuàng)建的置換數(shù)（默認(rèn)為5000）。
dist_fun：要使用的距離函數(shù)。默認(rèn)為Gower距離，但也可以使用Euclidean、Manhattan或dist()函數(shù)允許的任何其他距離函數(shù)。為了計(jì)算相似性，分類特征將根據(jù)它們是否等于實(shí)際觀察值進(jìn)行重新編碼。如果連續(xù)特征被分箱（默認(rèn)值），則這些特征將根據(jù)它們是否與要解釋的觀察值在同一個(gè)箱中進(jìn)行重新編碼。然后，使用重新編碼的數(shù)據(jù)計(jì)算到原始觀察值的距離。
kernel_width：為了將距離度量轉(zhuǎn)換為相似度得分，使用用戶定義的寬度的指數(shù)核（默認(rèn)為特征數(shù)的0.75倍的平方根）。
n_features：最能描述預(yù)測結(jié)果的特征數(shù)。
feature_select：lime::lime()可以使用前向選擇、嶺回歸、LASSO或決策樹來選擇“最佳”的n_features特征。
對(duì)于分類模型，我們需要指定一些額外的參數(shù)：
labels：要解釋的特定標(biāo)簽（類）（例如，0/1，“是”/“否”）？
n_labels：要解釋的標(biāo)簽數(shù)。

如果原始的機(jī)器學(xué)習(xí)模型是回歸模型，局部模型將直接預(yù)測復(fù)雜模型的輸出結(jié)果。如果是分類器，局部模型將預(yù)測所選擇類別的概率。
通過lime::explain()函數(shù)得到的輸出是一個(gè)包含各種信息的數(shù)據(jù)框，用于描述局部模型的預(yù)測結(jié)果。其中最重要的信息是對(duì)于每個(gè)提供的觀測值，它包含了擬合的解釋模型 (model_r2) 和每個(gè)重要特征 (feature_desc) 的加權(quán)重要性 (feature_weight)，用于最佳描述局部關(guān)系。

glimpse(lime_explanation)
# Rows: 40
# Columns: 13
# $ model_type       <chr> "classification", "classification", "classification", "classification", "classification~
# $ case             <chr> "TCGA-D5-6530", "TCGA-D5-6530", "TCGA-D5-6530", "TCGA-D5-6530", "TCGA-D5-6530", "TCGA-D~
#   $ label            <chr> "Alive", "Alive", "Alive", "Alive", "Alive", "Alive", "Alive", "Alive", "Alive", "Alive~
# $ label_prob       <dbl> 0.99, 0.99, 0.99, 0.99, 0.99, 0.99, 0.99, 0.99, 0.99, 0.99, 0.01, 0.01, 0.01, 0.01, 0.0~
# $ model_r2         <dbl> 0.01444325, 0.01444325, 0.01444325, 0.01444325, 0.01444325, 0.01444325, 0.01444325, 0.0~
# $ model_intercept  <dbl> 0.7045399, 0.7045399, 0.7045399, 0.7045399, 0.7045399, 0.7045399, 0.7045399, 0.7045399,~
# $ model_prediction <dbl> 0.7756461, 0.7756461, 0.7756461, 0.7756461, 0.7756461, 0.7756461, 0.7756461, 0.7756461,~
# $ feature          <chr> "ABCA1", "ABCC4", "ABHD3", "AAMP", "ABHD2", "ABCG1", "ABCG2", "ABCD3", "AC000111.2", "A~
#   $ feature_value    <dbl> 1.4922773, 0.8637574, 3.8144376, 6.1803265, 4.3477301, 2.2083119, 0.2595689, 3.2786676,~
#   $ feature_weight   <dbl> 0.02450017, -0.02491953, -0.02346769, 0.02196452, 0.02330070, 0.01894933, -0.01702930, ~
#   $ feature_desc     <chr> "1.475 < ABCA1 <= 1.642", "ABCC4 <= 1.17", "3.66 < ABHD3 <= 3.92", "6.17 < AAMP", "4.29~
# $ data             <list> [1.041423, 4.595776, 1.484305, 3.626439, 2.718439, 0.09743433, 0.594286, 1.95217, 3.91~
# $ prediction       <list> [0.99, 0.01], [0.99, 0.01], [0.99, 0.01], [0.99, 0.01], [0.99, 0.01], [0.99, 0.01], [0~

我們看看可視化的結(jié)果。然而，需要注意模型的低R2（“解釋適配度”）。局部模型的擬合效果似乎相當(dāng)差，因此我們不應(yīng)過于依賴這些解釋。

plot_features(lime_explanation, ncol =2)

2.3參數(shù)調(diào)整

在執(zhí)行LIME（局部解釋性模型）時(shí)，我們可以調(diào)整幾個(gè)參數(shù)，將它們視為調(diào)參參數(shù)，這樣可以嘗試調(diào)整局部模型。這有助于最大程度地增加局部解釋性模型的可信性。

#LIME算法調(diào)參
lime_explanation2 <- explain(
  x =data_new, 
  explainer = components_lime, 
  n_permutations = 5000,
  dist_fun = "euclidean",
  kernel_width = 0.75,
  n_labels = 2,
  n_features = 10, 
  feature_select = "lasso_path"
)

#可視化結(jié)果
plot_features(lime_explanation2, ncol = 2)

在上面的調(diào)參過程中，我們將距離函數(shù)更改為歐幾里得距離，增加了核寬度以創(chuàng)建更大的局部區(qū)域，并將特征選擇方法改為基于LARS的LASSO模型。

2.4其他可供選擇的方法

上面的示例我們主要圍繞在表格數(shù)據(jù)集中使用LIME進(jìn)行解釋性模型的構(gòu)建。然而，LIME也可以應(yīng)用于非傳統(tǒng)數(shù)據(jù)集，例如文本和圖像。對(duì)于文本數(shù)據(jù)，LIME會(huì)創(chuàng)建一個(gè)包含擾動(dòng)文本的新的文檔-詞矩陣（例如，它會(huì)基于現(xiàn)有文本生成新的短語和句子）。然后，LIME會(huì)按照類似的步驟對(duì)生成的文本與原始文本的相似性進(jìn)行加權(quán)。局部模型然后幫助確定在擾動(dòng)文本中哪些詞語產(chǎn)生了最強(qiáng)的信號(hào)。

對(duì)于圖像數(shù)據(jù)，LIME會(huì)通過用一個(gè)常量顏色（例如灰色）替換某些像素組合來創(chuàng)建圖像的變體。然后，LIME會(huì)評(píng)估給定未擾動(dòng)像素組的預(yù)測標(biāo)簽。

3.SHAP值

3.1背景

SHAP（SHapley Additive exPlanations）是一種解釋機(jī)器學(xué)習(xí)模型預(yù)測的方法，它基于合作博弈理論中的Shapley值概念。SHAP通過計(jì)算每個(gè)特征對(duì)于模型預(yù)測輸出的貢獻(xiàn)，幫助我們理解模型預(yù)測的原因和解釋。

在機(jī)器學(xué)習(xí)中，模型預(yù)測的輸出往往由多個(gè)特征共同決定。SHAP通過考慮每個(gè)特征值與其他特征值之間的交互作用，將模型預(yù)測的總體變化分配給每個(gè)特征。這樣，我們可以了解每個(gè)特征對(duì)于模型輸出的相對(duì)重要性，以及特征之間的相互作用對(duì)預(yù)測的影響。

SHAP值具有以下特點(diǎn)：

公平性：SHAP值確保在所有可能的特征子集中，特征的貢獻(xiàn)是公平的，不受其他特征的影響。
一致性：SHAP值滿足Shapley值的一致性屬性，即如果兩個(gè)模型預(yù)測相同，但是特征值不同，那么它們的SHAP值應(yīng)該相同。
局部解釋性：SHAP值提供了對(duì)于單個(gè)樣本的局部解釋，即了解某個(gè)特定樣本的預(yù)測結(jié)果是由哪些特征貢獻(xiàn)決定的。

在之前的推文中我們介紹了R和Python中SHAP值的可視化過程，當(dāng)然也包括生存數(shù)據(jù)的SHAP值可視化。在這次的示例中我們將一起學(xué)習(xí)如何通過iml包實(shí)現(xiàn)SHAP值的可視化。

#SHAP
#提取特征
features <- as.data.frame(train_h2o) %>% select(-Event)

#提取響應(yīng)變量
response <- as.data.frame(train_h2o) %>% pull(Event)

#自定義函數(shù)
pred <- function(object, newdata)  {
  results <- as.vector(h2o.predict(object, as.h2o(newdata)))
  return(results)
}

#創(chuàng)建一個(gè)iml模型無關(guān)對(duì)象
components_iml <- Predictor$new(
  model = ensemble_tree, 
  data = features, 
  y = response, 
  predict.fun = pred
)
#計(jì)算SHAP值
(shapley <- Shapley$new(components_iml, x.interest =data_new, sample.size =1000))
# |========================================================================================================| 100%
# |========================================================================================================| 100%
# |========================================================================================================| 100%
# |========================================================================================================| 100%
# |========================================================================================================| 100%
# |========================================================================================================| 100%
# Interpretation method:  Shapley 
# Predicted value: 0.980000, Average prediction: 0.703570 (diff = 0.276430) Predicted value: 0.020000, Average prediction: 0.296430 (diff = -0.276430)
# 
# Analysed predictor: 
#   Prediction task: unknown 
# 
# 
# Analysed data:
#   Sampling from data.frame with 338 rows and 101 columns.
# 
# 
# Head of results:
#   feature class           phi     phi.var            feature.value
# 1    A1CF Alive  0.0017600000 0.006776857    A1CF=1.04142313260927
# 2     A2M Alive -0.0016233333 0.001454914     A2M=4.59577575137959
# 3  A4GALT Alive -0.0028233333 0.002947425  A4GALT=1.48430469549071
# 4    AAAS Alive -0.0008516667 0.005436699    AAAS=3.62643913669732
# 5    AACS Alive  0.0077550000 0.007041842    AACS=2.71843944462677
# 6   AADAC Alive  0.0004400000 0.002993781 AADAC=0.0974343320963354
#可視化結(jié)果
plot(shapley)

上述過程的計(jì)算時(shí)間主要取決于預(yù)測變量的數(shù)量和樣本大小。默認(rèn)情況下，Shapley$new()函數(shù)只使用100個(gè)樣本，但我們可以通過控制參數(shù)來減少計(jì)算時(shí)間或增加估計(jì)值的可信性。

由于iml使用R6，我們可以重復(fù)使用Shapley對(duì)象來解釋特征對(duì)預(yù)測結(jié)局的影響。

#繼續(xù)使用shapley值解釋感興趣的觀測值
shapley$explain(x.interest =data_new)

#可視化結(jié)果
shapley$results %>%
  top_n(20, wt = abs(phi)) %>%
  ggplot(aes(phi, reorder(feature.value, phi), color = phi > 0)) +
  geom_point(size=3)+
  scale_color_brewer(palette = "Set2")+
  theme_bw()

今天的分享就到這里了。下次我們將分享XGBoost算法中SHAP值的可視化，也是比較經(jīng)典的可視化，另外我們將分享最后一個(gè)iml方法—Localized step-wise procedure。下次分享后我們的R與機(jī)器學(xué)習(xí)系列推文也就基本到尾聲了，后面的無監(jiān)督機(jī)器學(xué)習(xí)算法暫時(shí)不做重點(diǎn)分享。后續(xù)的分享重點(diǎn)將圍繞Python與機(jī)器學(xué)習(xí)系列展開。因?yàn)樵诜窒磉^程中發(fā)現(xiàn)R中進(jìn)行機(jī)器學(xué)習(xí)算法運(yùn)算時(shí)還是比較耗時(shí)間、耗內(nèi)存，尤其是在樣本量很大的情況下，就不得不借助Python了。另外，Python才是機(jī)器學(xué)習(xí)的主流。后續(xù)我們將從Python基礎(chǔ)知識(shí)逐漸過渡到Python與機(jī)器學(xué)習(xí)系列。歡迎一起學(xué)習(xí)！

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

R與機(jī)器學(xué)習(xí)系列|15.可解釋的機(jī)器學(xué)習(xí)算法（Interpretable Machine Learning）（中）

R與機(jī)器學(xué)習(xí)系列|15.可解釋的機(jī)器學(xué)習(xí)算法（Interpretable Machine Learning）（中）

1.特征交互（Feature interactions）

1.1介紹

1.2實(shí)施

1.3其他可供選擇方法

2.局部可解釋模型無關(guān)解釋（Local interpretable model-agnostic explanations）

2.1介紹

2.2實(shí)施

2.3參數(shù)調(diào)整

2.4其他可供選擇的方法

3.SHAP值

3.1背景

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

R與機(jī)器學(xué)習(xí)系列|15.可解釋的機(jī)器學(xué)習(xí)算法（Interpretable Machine Learning）（中）

1.特征交互（Feature interactions）

1.1介紹

1.2實(shí)施

1.3其他可供選擇方法

2.局部可解釋模型無關(guān)解釋（Local interpretable model-agnostic explanations）

2.1介紹

2.2實(shí)施

2.3參數(shù)調(diào)整

2.4其他可供選擇的方法

3.SHAP值

3.1背景

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av