BOF、VLAD特征
最早的VLAD特征就是為了做圖像檢索,主要思想是把N個圖像提取共n個向量(n>N,每個圖像不止一個向量),把n個向量做聚類,比如K-means,得到K個聚類中心。
然后對n個向量做聚類,看看每個聚類中心分別分了多少個點,把每個聚類中心的點的數(shù)量做直方圖,就是BOF。
如果說n個向量找到各自的中心后,每個向量都減去各自的中心(殘差)。對于聚類中心周圍所有點的殘差加和得到一個d維向量,把K個聚類中心對應的d維向量都拼到一起得到一個Kxd維向量,這就得到了VLAD特征。
NetVLAD
- NetVLAD的聚類中心都是可學習的
- 和VLAD算法不同,每個點不是通過聚類的方式得到聚類中心的,用的是soft的方式,相當于每個點都同時屬于所有聚類中心,但是有一定概率。
- NetVLAD特征還是通過加權(quán)求和的方式得到。