Computer Vision Advent Calendar 2012 3日目

この記事について
お題は画像検索
Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search.
Accurate image search using the contextual dissimilarity measure
City-scale location recognition.
雑なまとめ
最後に

この記事について†

この記事はComputer Vision Advent Calendar 2012の3日目&note{cv-advent-calendar:Computer Vision Advent Calendar 2012, 2012-12-01閲覧};の(ry
詳しくは(ry&note{cv-advent-calendar};
3日目の今日は論文サーベイの紹介

お題は画像検索†

画像検索に関連する論文を3篇、斜め読み。
Abstractをもとに、論文を雑にざっと紹介

Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search.†

``Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search'', Herve Jegou, Matthijs Douze, and Cordelia Schmid: ECCV 2008, Part I. LNCS, vol. 5302, pp. 304--317. Springer, Heidelberg (2008)

画像検索の性能向上に関する論文。
最近の論文はBoF (Bag of Features) で画像を表現するアプローチがさかん。そこに
- Hamming Embedding
- Weak Geometric Consistency(弱幾何一貫性)
- の2つを導入することで良くする。
Hamming Embedding(HE)にすることで、バイナリ表現が可能になり、VisualWordsのマッチングを改良する。
WGCを使うことで角度とスケールがめちゃくちゃなマッチングを除去できる。
WeakじゃなくてFullの幾何拘束を使うことで、もっとよくできる可能性があると述べてる

http://lear.inrialpes.fr/pubs/2008/JDS08/jegou_hewgc08.pdf

↑

Accurate image search using the contextual dissimilarity measure†

``Accurate image search using the contextual dissimilarity measure'', Jegou, H.:PAMI Vol. 32, No. 2, 2--11 (2009)

Contextual Dissimilarity measure という、内容の相違度を用いることで、BoFマッチングを劇的に改善すると。
局所的なvectorの分布とSinkohrn scaling アルゴリズムを使うことで、良くなる。
ついでにパラメータたちを大量にupdateしている

http://hal.inria.fr/docs/00/57/67/91/PDF/jegou_cdm_preprint.pdf

↑

City-scale location recognition.†

``City-Scale Location Recognition'', G. Schindler, M. Brown and R. Szeliski: International Conference on Comptuer Vision and Pattern Recognition (CVPR2007). Minneapolis, June 2007.

large image set 内のlocation recognition の問題を vocabulary treeで解決する
database の size がでかくなると従来のinvariant feature matching が歩留まり悪くなる
informative な features を使うことで、10のオーダでデータベースが大きくなる

http://www.cc.gatech.edu/~phlosoft/files/schindler07cvpr2.pdf

↑

雑なまとめ†

こいつらが結局やってることは、検索性能の向上のお話です。
検索のために、局所特徴量を導入して、無数の特徴点を抽出し、予め得られているデータベースと照合することで、目的の場所だったり画像だったり人物を検出する研究です。
そのためにはVisual Wordsと呼ばれる、単語検索システムに使われる技術が適用されていたりします。
単語検索技術のためにはVisual Wordsと呼ばれるある単語に関することを言及しているか、言及していないか、そのbinaryの情報を提示していたりします。
そのマッチングで、類似文章を見つける技術ですが、これが画像特徴量にも使えるわけであります。
この技術を使って、Google の画像検索なんかは作られているわけですね。

↑

最後に†

手島の担当は12月3日だけで、それは一昨日投稿した記事と昨日投稿した記事でもう担当分は終わってるのだが、なんとなく空き枠が(ry
もうネタがないので、あとは他の方々(ry
企画者の @sakanazensen&note{twitter-sakanazensen:@sakanazensen, 2012-12-01閲覧}; くんに感謝！

Computer Vision Advent Calendar 2012 3日目

この記事について†

お題は画像検索†

Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search.†

Accurate image search using the contextual dissimilarity measure†

City-scale location recognition.†

雑なまとめ†

最後に†

最新の20件