視覺地點識別Visual Place Recognition

BOF、VLAD特征

最早的VLAD特征就是為了做圖像檢索,主要思想是把N個圖像提取共n個向量(n>N,每個圖像不止一個向量),把n個向量做聚類,比如K-means,得到K個聚類中心。
然后對n個向量做聚類,看看每個聚類中心分別分了多少個點,把每個聚類中心的點的數(shù)量做直方圖,就是BOF。
如果說n個向量找到各自的中心后,每個向量都減去各自的中心(殘差)。對于聚類中心周圍所有點的殘差加和得到一個d維向量,把K個聚類中心對應的d維向量都拼到一起得到一個Kxd維向量,這就得到了VLAD特征。

NetVLAD

  1. NetVLAD的聚類中心都是可學習的
  2. 和VLAD算法不同,每個點不是通過聚類的方式得到聚類中心的,用的是soft的方式,相當于每個點都同時屬于所有聚類中心,但是有一定概率。
  3. NetVLAD特征還是通過加權(quán)求和的方式得到。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容