#contents

*この記事について [#l491410a]
-この記事は[[Computer Vision Advent Calendar 2012>http://partake.in/events/13622c9b-3ada-4dd8-a967-56fe8927541b]]の3日目&note{cv-advent-calendar:[[Computer Vision Advent Calendar 2012>http://partake.in/events/13622c9b-3ada-4dd8-a967-56fe8927541b]], 2012-12-01閲覧};の(ry
-詳しくは(ry&note{cv-advent-calendar};
-3日目の今日は論文サーベイの紹介

*お題は画像検索 [#eb91ca63]
-画像検索に関連する論文を3篇、斜め読み。
-Abstractをもとに、論文を%%雑に%%ざっと紹介

*Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search. [#x2218ed6]
 ``Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search'', Herve Jegou, Matthijs Douze, and Cordelia Schmid: ECCV 2008, Part I. LNCS, vol. 5302, pp. 304--317. Springer, Heidelberg (2008)
-画像検索の性能向上に関する論文。
-最近の論文はBoF (Bag of Features) で画像を表現するアプローチがさかん。そこに
--Hamming Embedding 
--Weak Geometric Consistency(弱幾何一貫性)
--の2つを導入することで良くする。
-Hamming Embedding(HE)にすることで、バイナリ表現が可能になり、VisualWordsのマッチングを改良する。
-WGCを使うことで角度とスケールがめちゃくちゃなマッチングを除去できる。
-WeakじゃなくてFullの幾何拘束を使うことで、もっとよくできる可能性があると述べてる

http://lear.inrialpes.fr/pubs/2008/JDS08/jegou_hewgc08.pdf

*Accurate image search using the contextual dissimilarity measure [#r4ab8a20]
 ``Accurate image search using the contextual dissimilarity measure'', Jegou, H.:PAMI Vol. 32, No. 2, 2--11 (2009)

-Contextual Dissimilarity measure という、内容の相違度を用いることで、BoFマッチングを劇的に改善すると。
-局所的なvectorの分布とSinkohrn scaling アルゴリズムを使うことで、良くなる。
-ついでにパラメータたちを大量にupdateしている

http://hal.inria.fr/docs/00/57/67/91/PDF/jegou_cdm_preprint.pdf

*City-scale location recognition. [#b4949c06]
 ``City-Scale Location Recognition'', G. Schindler, M. Brown and R. Szeliski: International Conference on Comptuer Vision and Pattern Recognition (CVPR2007). Minneapolis, June 2007. 
-large image set 内のlocation recognition の問題を vocabulary treeで解決する
-database の size がでかくなると従来のinvariant feature matching が歩留まり悪くなる
-informative な features を使うことで、10のオーダでデータベースが大きくなる

http://www.cc.gatech.edu/~phlosoft/files/schindler07cvpr2.pdf


*雑なまとめ [#c82995f2]
-こいつらが結局やってることは、検索性能の向上のお話です。
-検索のために、局所特徴量を導入して、無数の特徴点を抽出し、予め得られているデータベースと照合することで、目的の場所だったり画像だったり人物を検出する研究です。
-そのためにはVisual Wordsと呼ばれる、単語検索システムに使われる技術が適用されていたりします。
-単語検索技術のためにはVisual Wordsと呼ばれるある単語に関することを言及しているか、言及していないか、そのbinaryの情報を提示していたりします。
-そのマッチングで、類似文章を見つける技術ですが、これが画像特徴量にも使えるわけであります。
-この技術を使って、Google の画像検索なんかは作られているわけですね。

*最後に [#cb4eee6c]
-手島の担当は12月3日だけで、それは[[一昨日投稿した記事>Computer Vision Advent Calendar 2012]]と[[昨日投稿した記事>Computer Vision Advent Calendar 2012 2日目]]でもう担当分は終わってるのだが、なんとなく空き枠が(ry
-もうネタがないので、あとは他の方々(ry
-企画者の [[@sakanazensen>https://twitter.com/sakanazensen/]]&note{twitter-sakanazensen:[[@sakanazensen>https://twitter.com/sakanazensen/]], 2012-12-01閲覧}; くんに感謝!

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS