035: ***
A Perceptual Measure for Deep Single Image Camera Calibration
深度單鏡頭相機(jī)校準(zhǔn)的感知測(cè)量
1.深度卷積神經(jīng)網(wǎng)絡(luò)、
2.大多數(shù)當(dāng)前的單圖像相機(jī)校準(zhǔn)方法依賴于特定的圖像特征或用戶輸入,并且不能應(yīng)用于在不受控制的設(shè)置中捕獲的自然圖像。我們建議使用深度卷積神經(jīng)網(wǎng)絡(luò)從單個(gè)圖像直接推斷相機(jī)校準(zhǔn)參數(shù)。該網(wǎng)絡(luò)使用來(lái)自大規(guī)模全景數(shù)據(jù)集的自動(dòng)生成的樣本進(jìn)行訓(xùn)練,并且在標(biāo)準(zhǔn)L2誤差方面明顯優(yōu)于其他方法,包括最近基于深度學(xué)習(xí)的方法。本文開(kāi)發(fā)了一種新的相機(jī)校準(zhǔn)感知測(cè)量方法,用以證明此深度校準(zhǔn)網(wǎng)絡(luò)優(yōu)于其他方法。
3.在本文中,首先分析了人類對(duì)于虛擬物體插入環(huán)境圖片時(shí)相機(jī)的俯仰角,滾動(dòng)和視野估計(jì)誤差的敏感性。研究表明,人類并不總是對(duì)大錯(cuò)誤敏感,特別是當(dāng)滾動(dòng)發(fā)音時(shí),或者視野低估時(shí),所以提出了一種基于CNN的單圖像校準(zhǔn)估計(jì)方法,該方法可以支持圖像檢索,幾何一致的2D對(duì)象傳輸和虛擬3D對(duì)象插入等應(yīng)用。經(jīng)過(guò)調(diào)查,發(fā)現(xiàn)學(xué)習(xí)模型正在尋找具有語(yǔ)義意義的消失線,與基于幾何的自動(dòng)校準(zhǔn)技術(shù)相似。最后,利用用戶研究結(jié)果來(lái)定義基于人類感知的距離函數(shù),用于將CNN與以前的方法進(jìn)行比較。
4.本文CNN在大量現(xiàn)實(shí)場(chǎng)景中十分穩(wěn)健,但是當(dāng)前水平線參數(shù)化不能表示極端俯仰角。
5.Yannick Hold-Geoffroy, Kalyan Sunkavalli 美國(guó)