前面我們已經(jīng)學習了如何處理類別不平衡。這節(jié)課我們來探討第二個挑戰(zhàn)-多任務(wù)挑戰(zhàn)
目前為止,我們已經(jīng)研究了二分類,我們關(guān)心的是一個例子是否是有 mass 疾病。
然而,在現(xiàn)實世界中,我們關(guān)心的是對許多此類疾病的存在與否進行分類?,F(xiàn)在,一個簡單的方法是讓每個模型學習分別學習這些任務(wù)中的一個。即A模型學習是否有肺炎,B 模型學習是否有氣胸等。
當然,我們可以學習使用一個模型來完成所有的任務(wù)。即多任務(wù)學習。

這樣做的一個好處是,我們可以學習識別多種疾病的共同特征,從而使我們能夠更有效地利用現(xiàn)有數(shù)據(jù)。這是多任務(wù)學習的設(shè)置。
讓我們看看如何訓練算法同時學習所有這些任務(wù)。

如圖,這些例子不再是一個標簽,而是每個疾病都有一個標簽。零表示沒有該疾病,而1表示該疾病的存在。
假設(shè)我們這里的任務(wù)是預(yù)測胸片中是否包含3中疾?。╩ass, pneumonia, edema)(腫塊,肺炎,水腫)。
如患者P1,標簽為(0,1,0)。表示沒有腫塊,有肺炎,沒有水腫。
該模型不再有一個輸出,而是有三個不同的輸出,表示三種不同疾病的概率。
為了訓練這樣一個算法,我們還需要將損失函數(shù)從二分類loss 修改為多任務(wù)loss。讓我們看看如何做到這一點。
多任務(wù)損失函數(shù)

我們修改了損失函數(shù),這樣我們就可以看到與每種疾病相關(guān)的誤差。我們可以用多種疾病的損失之和來表示我們的新?lián)p失。如圖中公式。
這稱為multi-label(多標簽), multi-task(多任務(wù))損失。

在這個圖中,我們給出了每個例子的預(yù)測概率,以及每個類別下對應(yīng)的loss。
比如對于P1患者,mass疾病的預(yù)測概率為0.3, loss為0.52。pneumonia預(yù)測概率為0.1, loss為0.7。edama的預(yù)測概率為0.8, loss為0.7。對于P1,總的loss為它們之和。
最后要考慮的是如何在多任務(wù)設(shè)置中解釋類不平衡。

再一次,我們可以應(yīng)用之前我們已經(jīng)學過的加權(quán)損失。
只不過,在二分類中,陽性和陰性的權(quán)重分別只有一個。
但,對多分類而言,有幾種疾病,就有幾個不同的權(quán)重設(shè)置。比如,在圖片中,對mass疾病而言,它有,也有
。
同樣,pneumonia和edema也有,
。
我是Tina, 我們下篇博客見~
白天工作晚上寫文,嘔心瀝血
覺得寫的不錯的話最后,求點贊,評論,收藏