在服務(wù)器訓(xùn)練模型的時(shí)候,使用torch.nn.CrossEntropy()(pred, labels)的weight來計(jì)算類別加權(quán)l(xiāng)oss時(shí),報(bào)錯(cuò)Segmentation fault(core dumped),程序終止,并且沒有出現(xiàn)traceback,嘗試了網(wǎng)上說的很多種方法,唯獨(dú)沒敢嘗試conda --update all,這個(gè)指令還是不要輕易運(yùn)行。
然后我在控制臺(tái)輸出了pred和labels的具體值,是兩個(gè)正常的tensor,并且將其復(fù)制下來在本地運(yùn)行這一函數(shù),并未報(bào)錯(cuò)。
原來是需要把weight轉(zhuǎn)換為cpu的形式。即
loss_func = torch.nn.CrossEntropy(weight=weight.cpu())
loss = loss_func(pred, labels)
怪不得本地代碼沒問題,因?yàn)楸镜氐膚eight本來就是一個(gè)cpu形式的tensor... 雖然我也沒想明白原因是什么。