この記事について†
お題は画像検索†
- 画像検索に関連する論文を3篇、斜め読み。
- Abstractをもとに、論文を
雑にざっと紹介
Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search.†
``Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search'', Herve Jegou, Matthijs Douze, and Cordelia Schmid: ECCV 2008, Part I. LNCS, vol. 5302, pp. 304--317. Springer, Heidelberg (2008)
- 画像検索の性能向上に関する論文。
- 最近の論文はBoF (Bag of Features) で画像を表現するアプローチがさかん。そこに
- Hamming Embedding
- Weak Geometric Consistency(弱幾何一貫性)
- の2つを導入することで良くする。
- Hamming Embedding(HE)にすることで、バイナリ表現が可能になり、VisualWordsのマッチングを改良する。
- WGCを使うことで角度とスケールがめちゃくちゃなマッチングを除去できる。
- WeakじゃなくてFullの幾何拘束を使うことで、もっとよくできる可能性があると述べてる
http://lear.inrialpes.fr/pubs/2008/JDS08/jegou_hewgc08.pdf
Accurate image search using the contextual dissimilarity measure†
``Accurate image search using the contextual dissimilarity measure'', Jegou, H.:PAMI Vol. 32, No. 2, 2--11 (2009)
- Contextual Dissimilarity measure という、内容の相違度を用いることで、BoFマッチングを劇的に改善すると。
- 局所的なvectorの分布とSinkohrn scaling アルゴリズムを使うことで、良くなる。
- ついでにパラメータたちを大量にupdateしている
http://hal.inria.fr/docs/00/57/67/91/PDF/jegou_cdm_preprint.pdf
City-scale location recognition.†
``City-Scale Location Recognition'', G. Schindler, M. Brown and R. Szeliski: International Conference on Comptuer Vision and Pattern Recognition (CVPR2007). Minneapolis, June 2007.
- large image set 内のlocation recognition の問題を vocabulary treeで解決する
- database の size がでかくなると従来のinvariant feature matching が歩留まり悪くなる
- informative な features を使うことで、10のオーダでデータベースが大きくなる
http://www.cc.gatech.edu/~phlosoft/files/schindler07cvpr2.pdf
雑なまとめ†
- こいつらが結局やってることは、検索性能の向上のお話です。
- 検索のために、局所特徴量を導入して、無数の特徴点を抽出し、予め得られているデータベースと照合することで、目的の場所だったり画像だったり人物を検出する研究です。
- そのためにはVisual Wordsと呼ばれる、単語検索システムに使われる技術が適用されていたりします。
- 単語検索技術のためにはVisual Wordsと呼ばれるある単語に関することを言及しているか、言及していないか、そのbinaryの情報を提示していたりします。
- そのマッチングで、類似文章を見つける技術ですが、これが画像特徴量にも使えるわけであります。
- この技術を使って、Google の画像検索なんかは作られているわけですね。
最後に†