#contents

*この記事について [#l491410a]
-この記事は[[Computer Vision Advent Calendar 2012>http://partake.in/events/13622c9b-3ada-4dd8-a967-56fe8927541b]]の3日目&note{cv-advent-calendar:[[Computer Vision Advent Calendar 2012>http://partake.in/events/13622c9b-3ada-4dd8-a967-56fe8927541b]], 2012-12-01閲覧};の(ry
-詳しくは(ry&note{cv-advent-calendar};
-3日目の今日は論文サーベイの紹介

*お題は画像検索 [#eb91ca63]
-画像検索に関連する論文を3篇、斜め読み。
-Abstractをもとに、論文を%%雑に%%ざっと紹介

*Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search. [#x2218ed6]
 Jegou, H., Douze, M., Schmid, C.: Hamming Embedding and Weak Geometric Consistency for Large Scale Image Search. In: Forsyth, D., Torr, P., Zisserman, A. (eds.) ECCV 2008, Part I. LNCS, vol. 5302, pp. 304-317. Springer, Heidelberg (2008)
画像検索の性能向上に関する論文。
最近の論文はBoF (Bag of Features) で画像を表現するアプローチがさかん
-Hamming Embedding 
-弱幾何拘束
の2つを導入することで良くする。
HEにすることで、バイナリ表現が可能になり、VisualWordsのマッチングを改良する。
WGCを使うことで角度とスケールがめちゃくちゃなマッチングを除去できる。
WeakじゃなくてFullの幾何拘束を使うことで、もっとよくできる可能性があると述べてる

http://lear.inrialpes.fr/pubs/2008/JDS08/jegou_hewgc08.pdf

*Accurate image search using the contextual dissimilarity measure [#r4ab8a20]
 Jegou, H., Schmid, C., Harzallah, H., Verbeek, J.: Accurate image search using the contextual dissimilarity measure. PAMI 32, 2-11 (2009)
Contextual Dissimilarity measure という、内容の相違度を用いることで、BoFマッチングを劇的に改善すると。
局所的なvectorの分布と
Sinkohrn scaling アルゴリズムを使うことで、良くなる。
ついでにパラメータたちを大量にupdateしている

http://hal.inria.fr/docs/00/57/67/91/PDF/jegou_cdm_preprint.pdf

*City-scale location recognition. [#b4949c06]
 Schindler, G., Brown, M., Szeliski, R.: City-scale location recognition. In: CVPR(2007)
large image set 内のlocation recognition の問題を vocabulary treeで解決する
database の size がでかくなると従来のinvariant feature matching が歩留まり悪くなる
informative な features を使うことで、10のオーダでデータベースが大きくなる

http://www.cc.gatech.edu/~phlosoft/files/schindler07cvpr2.pdf


*雑なまとめ [#c82995f2]
-こいつらが結局やってることは、検索性能の向上のお話です。
-検索のために、局所特徴量を導入して、無数の特徴点を抽出し、予め得られているデータベースと照合することで、目的の場所だったり画像だったり人物を検出する研究です。
-そのためにはVisual Wordsと呼ばれる、単語検索システムに使われる技術が適用されていたりします。
-単語検索技術のためにはVisual Wordsと呼ばれるある単語に関することを言及しているか、言及していないか、そのbinaryの情報を提示していたりします。
-そのマッチングで、類似文章を見つける技術ですが、これが画像特徴量にも使えるわけであります。
-この技術を使って、Google の画像検索なんかは作られているわけですね。

*最後に [#cb4eee6c]
-手島の担当は12月3日だけで、それは[[一昨日投稿した記事>Computer Vision Advent Calendar 2012]]と[[昨日投稿した記事>Computer Vision Advent Calendar 2012 2日目]]でもう担当分は終わってるのだが、なんとなく空き枠が(ry
-もうネタがないので、あとは他の方々(ry
-企画者の [[@sakanazensen>https://twitter.com/sakanazensen/]]&note{twitter-sakanazensen:[[@sakanazensen>https://twitter.com/sakanazensen/]], 2012-12-01閲覧}; くんに感謝!


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS