第一課第一周12-13節(jié) 多任挑戰(zhàn)總結(jié)

前面我們已經(jīng)學習了如何處理類別不平衡。這節(jié)課我們來探討第二個挑戰(zhàn)-多任務(wù)挑戰(zhàn)

目前為止,我們已經(jīng)研究了二分類,我們關(guān)心的是一個例子是否是有 mass 疾病。

然而,在現(xiàn)實世界中,我們關(guān)心的是對許多此類疾病的存在與否進行分類?,F(xiàn)在,一個簡單的方法是讓每個模型學習分別學習這些任務(wù)中的一個。即A模型學習是否有肺炎,B 模型學習是否有氣胸等。

當然,我們可以學習使用一個模型來完成所有的任務(wù)。即多任務(wù)學習。

image

這樣做的一個好處是,我們可以學習識別多種疾病的共同特征,從而使我們能夠更有效地利用現(xiàn)有數(shù)據(jù)。這是多任務(wù)學習的設(shè)置。

讓我們看看如何訓練算法同時學習所有這些任務(wù)。

image

如圖,這些例子不再是一個標簽,而是每個疾病都有一個標簽。零表示沒有該疾病,而1表示該疾病的存在。

假設(shè)我們這里的任務(wù)是預(yù)測胸片中是否包含3中疾?。╩ass, pneumonia, edema)(腫塊,肺炎,水腫)。

如患者P1,標簽為(0,1,0)。表示沒有腫塊,有肺炎,沒有水腫。

該模型不再有一個輸出,而是有三個不同的輸出,表示三種不同疾病的概率。

為了訓練這樣一個算法,我們還需要將損失函數(shù)從二分類loss 修改為多任務(wù)loss。讓我們看看如何做到這一點。

多任務(wù)損失函數(shù)

image

我們修改了損失函數(shù),這樣我們就可以看到與每種疾病相關(guān)的誤差。我們可以用多種疾病的損失之和來表示我們的新?lián)p失。如圖中公式。

這稱為multi-label(多標簽), multi-task(多任務(wù))損失。

image

在這個圖中,我們給出了每個例子的預(yù)測概率,以及每個類別下對應(yīng)的loss。

比如對于P1患者,mass疾病的預(yù)測概率為0.3, loss為0.52。pneumonia預(yù)測概率為0.1, loss為0.7。edama的預(yù)測概率為0.8, loss為0.7。對于P1,總的loss為它們之和。

最后要考慮的是如何在多任務(wù)設(shè)置中解釋類不平衡。

image

再一次,我們可以應(yīng)用之前我們已經(jīng)學過的加權(quán)損失。

只不過,在二分類中,陽性和陰性的權(quán)重分別只有一個。

但,對多分類而言,有幾種疾病,就有幾個不同的權(quán)重設(shè)置。比如,在圖片中,對mass疾病而言,它有w_p,也有w_n。

同樣,pneumonia和edema也有w_p,w_n。

我是Tina, 我們下篇博客見~

白天工作晚上寫文,嘔心瀝血

覺得寫的不錯的話最后,求點贊,評論,收藏

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容