Predicting Deeper into the Future of Semantic Segmentation

任務(wù):

預(yù)測未來幀的場景分割,給定視頻幀的輸入序列,預(yù)測未觀察到的幀的場景圖。

動機:

預(yù)測像素值與預(yù)測高層次的場景相比過于復(fù)雜,然而后者對于大多數(shù)應(yīng)用都已經(jīng)足夠。例如軌跡。我們不對物體或者其他的場景元素建模,而是對物體類別的場景分割圖動態(tài)性建模。

模型:

用之前的multi-scale network


多步預(yù)測

1、batch 預(yù)測:一次性輸出所有的預(yù)測

2、autoregressive:循環(huán)預(yù)測

改進空間

隨著時間的增加,分割精度減小。雖然物體軌跡是合理的,但是不一定對應(yīng)真實的軌跡。如何利用GAN或VAE解決預(yù)測本質(zhì)的不確定性

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容