A Perceptual Measure for Deep Single Image Camera Calibration

035: ***

A Perceptual Measure for Deep Single Image Camera Calibration

深度單鏡頭相機(jī)校準(zhǔn)的感知測(cè)量

1.深度卷積神經(jīng)網(wǎng)絡(luò)、

2.大多數(shù)當(dāng)前的單圖像相機(jī)校準(zhǔn)方法依賴于特定的圖像特征或用戶輸入,并且不能應(yīng)用于在不受控制的設(shè)置中捕獲的自然圖像。我們建議使用深度卷積神經(jīng)網(wǎng)絡(luò)從單個(gè)圖像直接推斷相機(jī)校準(zhǔn)參數(shù)。該網(wǎng)絡(luò)使用來(lái)自大規(guī)模全景數(shù)據(jù)集的自動(dòng)生成的樣本進(jìn)行訓(xùn)練,并且在標(biāo)準(zhǔn)L2誤差方面明顯優(yōu)于其他方法,包括最近基于深度學(xué)習(xí)的方法。本文開(kāi)發(fā)了一種新的相機(jī)校準(zhǔn)感知測(cè)量方法,用以證明此深度校準(zhǔn)網(wǎng)絡(luò)優(yōu)于其他方法。

3.在本文中,首先分析了人類對(duì)于虛擬物體插入環(huán)境圖片時(shí)相機(jī)的俯仰角,滾動(dòng)和視野估計(jì)誤差的敏感性。研究表明,人類并不總是對(duì)大錯(cuò)誤敏感,特別是當(dāng)滾動(dòng)發(fā)音時(shí),或者視野低估時(shí),所以提出了一種基于CNN的單圖像校準(zhǔn)估計(jì)方法,該方法可以支持圖像檢索,幾何一致的2D對(duì)象傳輸和虛擬3D對(duì)象插入等應(yīng)用。經(jīng)過(guò)調(diào)查,發(fā)現(xiàn)學(xué)習(xí)模型正在尋找具有語(yǔ)義意義的消失線,與基于幾何的自動(dòng)校準(zhǔn)技術(shù)相似。最后,利用用戶研究結(jié)果來(lái)定義基于人類感知的距離函數(shù),用于將CNN與以前的方法進(jìn)行比較。


4.本文CNN在大量現(xiàn)實(shí)場(chǎng)景中十分穩(wěn)健,但是當(dāng)前水平線參數(shù)化不能表示極端俯仰角。

5.Yannick Hold-Geoffroy, Kalyan Sunkavalli 美國(guó)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容