勉強会/コンピュータビジョン勉強会@関東
[[コンピュータビジョン勉強会>https://sites.google.com/site/cvsaisentan/]] に参加した記録~
[[connpassのページ>http://kantocv.connpass.com/]]も開設しました&note{kantocv-connpass:[[コンピュータビジョン勉強会@関東 - connpass>http://kantocv.connpass.com/]], 2014-12-06閲覧};
#contents

*[[第35回(後編)「CVPR2016読み会 後編」>http://kantocv.connpass.com/event/35362/]] [#d9ab8221]
-会場はマイクロソフトジャパン様
-素晴らしい会場を提供いただき、ありがとうございます
**Improving Person Re-identification via Pose-aware Multi-shot Matching [#rc88d44a]
-発表は[[side_yuさん>https://twitter.com/side_yu]]
-資料は[[こちら>http://www.slideshare.net/ymats/20160724-cvpr2016reidentification]]
**Structure-from-Motion Revisited [#j61cf807]
-発表は[[OZ_Z_Cさん>https://twitter.com/OZ_Z_C]]
-資料は[[こちら>http://www.slideshare.net/KyoheiUnno/20160724cvsfmrevisited]]
**CNN-RNN: A Unified Framework for Multi-Label Image Classification [#dc19d3f8]
-発表はtoshiki_sakaiさん
-資料は[[こちら>http://docs.google.com/presentation/d/1NcFT0YJbQUe1kMF8DMEB3OPmcazhMzZ_sPenmKYSdxA/]]
**ASP Vision: Optically Computing the First Layer of Convolutional Neural Networks [#bfce39b0]
-発表は[[mhr380さん>https://twitter.com/mhr380]]
-資料は[[こちら>http://www.slideshare.net/hajimemihara/0727-cvpr16-aspvisionupload]]
-ピクセル表面に回折格子を貼り付けることで、角度の情報をセンサの時点で取得する
-Angle Sensitive Pixels (ASP) Camera
-Talbot回折という、回折格子を2枚貼り付ける。それにより、光が強め合ったり弱め合ったりして角度情報が得られる。
-HWに手を入れて精度が上がるってのは、なかなかに面白い話
-でもHW作ったのが貢献かな?
**The Cityscapes Dataset for Semantic Urban Scene Understanding [#z9d8184b]
-発表は[[yosuke_shinyaさん>https://twitter.com/shinya7y]]
-資料は[[こちら>http://www.slideshare.net/YosukeShinya/dataset-for-semantic-urban-scene-understanding]]
-Semantic Segmentationは物体検出よりもっと細かくて、ピクセルレベルでのラベル付が必要
-Semantic Segmentation だと、CNNを使うのが一般的
-Curse of Dataset Annotation。大量のアノテーションは非常に時間がかかる
-アノテーションデータを増やすために、人手でやったり、3Dスキャンデータを使ったり、CGを使ったりするアプローチがある。
--人手でやる論文: Cityscapes
--Fine annotations と
**Structural-RNN: Deep Learning on Spatio-Temporal Graphs [#pfecc0f5]
-発表は[[Rezoolabさん>https://twitter.com/Rezoolab]]
-資料は[[こちら>https://drive.google.com/open?id=0B2jjEPJ1cl_Ob204ZWZEdHhYY28]]
**Learning Sparse High Dimensional Filters: Image Filtering, Dense CRFs and Bilateral Neural Networks [#u757bba1]
-発表は[[jin_yamanakaさん>https://twitter.com/Jiny2001]]
-CNNを多次元疎空間の特徴検出に使って、Bilateral filterを学習でパラメータを決定(?)する
-Bilateral Neural Networks
-ガウシアンの呪縛から解き放たれた!
-色の認識や、文字認識相手にも、Bilateral Layerを入れたほうが性能が上がる!
**We Are Humor Beings: Understanding and Predicting Visual Humor [#p5820ba6]
-発表は[[losnuevetorosさん>https://twitter.com/losnuevetoros]]
-資料は[[こちら>]]
**懇親会 [#z8e95711]
*[[第35回(前編)「CVPR2016読み会 前編」>http://kantocv.connpass.com/event/35303/]] [#f5d917ee]
-今回はドワンゴ様から会場を貸して頂きました。ありがとうございました。
-[[Togetterはこちら>http://togetter.com/li/1001286]]
-今回は8名の方に発表頂きました。
**Discriminative Invariant Kernel Features: A Bells-and-Whistles-Free Approach to Unsupervised Face Recognition and Pose Estimation [#p70129f1]
-[[@takmin>https://twitter.com/takmin]]さんの発表で資料は[[こちら>http://www.slideshare.net/takmin/20160717-dikf]]
**Sparsifying Neural Network Connections for Face Recognition [#xd438778]
-[[@51takahashi>https://twitter.com/51takahashi]]さんの発表で資料は[[こちら>http://www.slideshare.net/KoichiTakahashi/cvpr2016-sparsifying-neural-network-connections-for-face-recognition]]
-CNNを使うけれど、顔認識(識別)のためには、隠れ層の最後のレイヤ(最終出力層の1つ手前)を使う
-この最終出力層への入力を、特徴ベクトルと見立てる
**特徴量学習とクロスモーダル転移 [#a45ce8f2]
-[[@_akisato>https://twitter.com/_akisato]]さんの発表で資料は[[こちら>http://www.slideshare.net/akisatokimura/cvpr2016-reading]]
-クロスモーダルなのであるエリアで学習した内容が、別の問題で活かせるか、という研究
-一つの論文だけでなく横断的に紹介頂きました
-自分が見つけたい対象に関する学習データが全く無い状態をzero shot learningという
**Sketch Me That Shoe [#t0030f50]
-[[@Hi_king>https://twitter.com/Hi_king]]さんの発表で資料は[[こちら>http://niconare.nicovideo.jp/watch/kn1615]]
-今回会場貸出の件を受けていただいたHi_kingさん。ありがとうございました。
-手書きのスケッチから、すでにある2次元画像を得る研究
-「ほら、あれ、あれ、あの変な形したあれ」みたいな言葉にするのが難しいときに、書いてしまえば一発解決、という話
**Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks [#f7a88d69]
-[[masataka_yamaguchi>https://twitter.com/gutta1016]]さんの発表で、資料は[[こちら>http://drive.google.com/file/d/0B60IMygV5I00SVlFQmE2c2w5ZTQ/]]
**Deep SimNets [#d9087f59]
-[[@peisuke>https://twitter.com/peisuke]]さんの発表で資料は[[こちら>http://www.slideshare.net/FujimotoKeisuke/deep-simnets]]
**Convolutional Pose Machines [#i5a0e299]
-[[@_conta>https://twitter.com/_conta]]さんの発表で資料は[[こちら>https://speakerdeck.com/contaconta/convolutional-pose-machines]]
**HyperDepth: Learning Depth From Structured Light Without Matching [#i6d1e593]
-[[@tomoaki_teshima>https://twitter.com/tomoaki_teshima]]さんの発表で資料は[[こちら>http://www.slideshare.net/tomoaki0705/cvim-saisentancvprhyper-depth]]

*[[第34回CV勉強会「CV最先端ガイド4 第2章コンピュテーショナルフォトグラフィ理解のための光学系入門」>http://kantocv.connpass.com/event/31178/]] [#nd806ac5]
-今回は東大本郷キャンパスでの開催
*[[第33回CV勉強会 コンピュータビジョンで使えるツールLT大会>http://kantocv.connpass.com/event/27432/]] [#vf39e4c0]
-今回は東大生産研究所での開催
-Togetterは[[こちら>http://togetter.com/li/963928]]
-実装やライブラリに関するお話
-お昼時点で嵐が吹き荒れ、電車のダイヤが乱れてて皆さん会場に着くまでが大変でした。
-今回は参加者の協力もあり、スカスカでもなく、来たかったのに枠の都合で来れなかった人も少なかったかな?
-あとCV勉強会で「xxな人、一緒に論文読みませんか?」と募集をかける方が何名かいて、どんどん広がっていきそうな雰囲気
**オープニングトーク [#q39e5177]
-takminさん
-本日は15名(うち1名欠席)だったので、かなりかつかつの時間でした
**dlibによる顔器官検出 [#lc9dde58]
-発表は[[takminさん>https://twitter.com/takmin]]
-資料は[[こちら>http://www.slideshare.net/takmin/20160417dlib]]
**あの言語で画像処理する ライフブラリを作った件 [#t9bf94ba]
-発表は[[sakiyamakさん>https://twitter.com/sakiyamaK]]
-JavascriptでOpenCVをフルスクラッチで実装した件
-資料は[[こちら>http://www.slideshare.net/sakiyamaK/ss-61003505]]
-すごい!
**OpenVX、 NVIDIA VisionWorks使ってみた [#pb235a14]
-発表は[[dandelion1124さん>https://twitter.com/dandelion1124]]
-資料は[[こちら>http://www.slideshare.net/YasuhiroYoshimura/33openvx-nvidia-visionworks]]
-OpenVXの実装、お疲れ様でした!
**PyCharm入門 [#sfdacb63]
-発表は[[yuukicammyさん>https://twitter.com/yuukicammy]]
-資料は[[こちら>http://www.slideshare.net/yuukinagai1/pycharm]]
-PyCharm使えばリモートでの実行もらくらく。
**G2o [#ab87f948]
-発表は[[peisukeさん>https://twitter.com/peisuke]]
-資料は[[こちら>http://www.slideshare.net/FujimotoKeisuke/g2o-61002967]]
-ノードの配置問題を展開して色々な最適化に使える方法
**How to use scikit-image for data augmentation  [#qb7d4db7]
-発表は[[tereka114さん>https://twitter.com/tereka114]]
-資料は[[こちら>http://www.slideshare.net/hirokiyamamoto969/how-to-use-scikitimage-for-data-augmentation]]
**Chainerの紹介 [#i0797578]
-発表は[[tabe2314さん>https://twitter.com/tabe2314]]
-資料は[[こちら>http://www.slideshare.net/shoheihido/chainer-gtc-2016]] (実際はこちらの資料を手直しして使用されました)
-CuPyの紹介も絡めて話されました。
**OpenToonzというアニメ制作ソフトのCVプラグイン [#l250a327]
-発表は[[Keisuke_Ogakiさん>https://twitter.com/Hi_king]]
-ライブコーディングに挑戦して、無事動きました!
**openFrameworksの紹介 [#m99a81f8]
-発表は[[sdsgさん>https://twitter.com/sdsgisd]]
-資料は[[こちら>http://www.slideshare.net/sdsgisd/openframeworks-61003255]]
-こちらもライブのビルド、デモに挑戦され、無事動きました!
-さくっと動かすには軽くて便利なライブラリです!
**Deep Learningライブラリ 色々つかってみた感想まとめ [#tc6dc247]
-発表は[[conta_さん>https://twitter.com/conta_]]
-資料は[[こちら>https://speakerdeck.com/contaconta/deep-learningraiburari-se-tukatutemitagan-xiang-matome]]
-conta_さんは前日に名古屋CVでの発表されて、2日連続発表!
-Deep Learning のライブラリを広く紹介。しかも5つのライブラリに関しては使った感想をまとめて!すごい!
**動画像のばらし方 [#ocf19729]
-発表は[[kkeiさん>https://twitter.com/kkei]]
-資料は[[こちら>http://www.slideshare.net/KeiKawamura/ss-61000919]]
-なんと本勉強会史上初めての子連れでの参加!しかもお子さんを抱っこしながらの発表!
-お子さんはお利口に発表中静かにされてました。可愛かった!
-ffmpegは実は次の jellied_unagi さんとネタかぶり
-ffmpegの難解なオプションを紹介されてました
**映像処理タスクのためのffmpeg, dense trajectories [#s425d9de]
-発表は[[jellied_unagiさん>https://twitter.com/jellied_unagi]]
-資料は[[こちら>http://www.slideshare.net/yonetani/ffmpeg-dense-trajectories]]
-こちらもかわいい息子さんがビデオで登場
-ffmpegの謎も、kkeiさんが質疑応答で華麗に回答
**ごあいさつ或いはMATLAB教徒がPythonistaに改宗した話 [#md6b5530]
-発表は[[losnuevetorosさん>https://twitter.com/losnuevetoros]]
-次回から幹事として加わっていただきます!よろしくお願いします!
**半精度浮動小数点数 half [#kd224a8b]
-私の発表
-資料は[[こちら>http://www.slideshare.net/tomoaki0705/cvim-saisentan-half]]
-思う存分マニアックな発表をさせてもらいました。
**懇親会 [#t6ccc427]
-21名の大所帯!
-初めましての方々も、次回以降よろしくお願いします。
*[[第32回「ICCV2015読み会」>http://kantocv.connpass.com/event/24696/]] [#v0a8b931]
-今回は初めてドワンゴ様から会場を貸して頂きました。ありがとうございました。
**オープニングトーク [#cf87ff11]
-今回は計7名から発表いただきました
-[[セキココ>http://sekico.co/zaseki/647]]
**Generating Notifications for Missing Actions: Don’t forget to turn the lights off! [#wbf2bf79]
-[[losnuevetoros>http://twitter.com/losnuevetoros]] さんの発表
-資料は[[こちら>http://www.slideshare.net/YoshitakaUshiku/generating-notifications-for-missing-actionsdont-forget-to-turn-the-lights-off-cv-iccv-2015]]
-人間の行動シーケンスを学習し、「ある手順での抜け/忘れが無いか警告する」というお話
-論文ではラテを作る手順を、ウェアラブルカメラで撮影して実験していた
-ある意味かなり限定しないとまだまだ現実世界には適用できない気がする。
-また精度も正直イマイチな印象だが、明確なメッセージとデータセットを作ったことあたりがコントリビューション
**Deep Fried Convnets [#c149dddb]
-[[peisuke>http://twitter.com/peisuke]] さんの発表
-資料は[[こちら>http://www.slideshare.net/FujimotoKeisuke/deep-fried-convnets]]
-Deep Fried とか、 Fastfood とか、美味しそうなキーワードが並ぶ発表だった
-Deep Learning の全結合層での計算を省略して高速化するお話
**Hierarchical Convolutional Features for Visual Tracking [#wdbf0b67]
-[[conta_>http://twitter.com/conta_]] さんの発表
-資料は[[こちら>http://www.slideshare.net/takanoriogata1121/cv20160205-57945518]]
-Trackingと、時系列の学習のお話
-デモ!すごい!
-トラッキングするためには、物体の位置情報が重要だが、位置情報は上位レイヤに上がるに連れてPoolingにより失われてしまう
-そこで、Convlutionと、FFTでもとに戻す!すごい!
-デモ、ありがとうございました。
**Automated Facial Trait Judgment and Election Outcome Prediction: Social Dimensions of Face [#d368be1b]
-[[51takahashi>http://twitter.com/51takahashi]] さんの発表
-資料は[[こちら>http://www.slideshare.net/KoichiTakahashi/iccv2015-57943683]]
-ICCV2015の顔関連の論文を広く網羅した力作!
-「論文を読むのは作者の気持ちを理解する問題」
-「読み物としては最高に面白い」
-などなどの名言が生まれました
**Multi-scale recognition with DAG-CNNs [#u5ef2539]
-[[tereka114>http://twitter.com/tereka114]] さんの発表
-資料は[[こちら>http://www.slideshare.net/hirokiyamamoto969/multi-scale-recognition-with-dagcnns]]
-DAGはDirected Acyclic Graphの略で、有向非循環グラフの略
-デモも挑戦されてたが、惜しくも動かず、「メンタルリセット」
-どのレイヤが認識に寄与してるか、レイヤごとにわかる
**Web-Scale Image Clustering Revisited [#f7e2b947]
-[[Hi_king>http://twitter.com/Hi_king]] さんの発表
-資料は[[こちら>http://niconare.nicovideo.jp/watch/kn1086]]
-PQに対して、IQ-Meansを提案
-Inverted Quantized K-means の略でIQ-Means
-会場の提供ありがとうございました。
**Active Object Localization with Deep Reinforcement Learning [#n9785970]
-[[takmin>http://twitter.com/takmin]] さんの発表
-資料は[[こちら>http://www.slideshare.net/takmin/cvactive-object-localization-with-deep-reinfocement-learning]]
-教科学習で物体の位置検出する、ユニークなアプローチでした。
**懇親会 [#ifa2823a]
-ドワンゴ様の会場で、そのまま立食パーティー
*[[第31回「コンピュータビジョンのお仕事」>http://kantocv.connpass.com/event/19484/]] [#b3ca126e]
-今回は企業で実際に使われてるコンピュータビジョンの例を紹介頂きました。
-飛び込みも含め以下の10名から発表頂きました
-tomoaki_teshima
-Hi_king
-Hayato_Kapibara
-MitsuruAmbai
-losnuevetoros
-conta
-beat_itude
-seiya_kumada
-sonson_twit
-takmin
-会場はデンソーITラボラトリー様から提供を頂きました。ありがとうございました。
*[[第30回「CVPR2015読み会(後編)」>http://kantocv.connpass.com/event/16587/]] [#i7c21c00]
**オープニングトーク [#hc0904de]
**懇親会 [#c8569d1d]
*[[第30回「CVPR2015読み会(前編)」>http://kantocv.connpass.com/event/16586/]] [#q9f5bc1a]
**オープニングトーク [#yda148fb]
**Show and Tell: A Neural Image Caption Generator [#ya5feb52]
-takmin さんの発表
-まさかの私の発表とどっかぶり
-画像に対して、説明文を生成する研究
**Understanding Image Virality [#mbeb9179]
-_akisatoさんの発表
-ぶっちゃけると「SNSで『ウケる』画像を推定する」手法
-最後の晩餐に対して「Scientists Last Supper」である。これがウケるかどうかは画像だけで推定するのは難しい。
-SNSでウケるというのはPopularity と Virality と、違う
-[[http://www.slideshare.net/akisatokimura/cvpr2015-reading-understainding-image-virality-in-japanese]]
**Global Refinement of Random Forest [#v59bf9f7]
-51takahashiさんの発表
-Random Forest の最後の出力を、SVMと組み合わせて性能を上げたお話
-実験ではKinectの部位認識に適用
-[[Cvpr2015読み会-Global Refinement of Random Forest>http://www.slideshare.net/KoichiTakahashi/cvpr2015-50690338]]
**Sketch-based 3D Shape Retrieval using Convolutional Neural Networks [#yff429f7]
-[[a-i-to>https://twitter.com/aito6e]]
-Sketch から3Dモデルを探索してくる研究
**動作認識関連論文の概要紹介 [#fecae54e]
-動作検出、動作認識、映像要約に関する論文紹介
-[[jellied_unagi>https://twitter.com/jellied_unagi]]
-[[CVPR2015 論文紹介>http://www.slideshare.net/yonetani/cvpr2015-50697983]]
**Approximate Nearest Neighbor Fields in Video [#n0466e7a]
-[[けet-al.>https://twitter.com/avez_vous]]
-Nearest Neighborで探索を高速に行う話
-[[関東Cv勉強会@20150720 approximate nearest_neighbor_fields_in_video>http://www.slideshare.net/kerahiroshi/cv20150720-approximate-nearestneighborfieldsinvideo]]
**Joint Tracking and Segmentation of Multiple Targets [#d1010820]
-[[yuukicammy>https://twitter.com/yuukicammy]]
-[[CVPR2015読み会 "Joint Tracking and Segmentation of Multiple Targets">http://www.slideshare.net/yuukinagai1/joint-trackingandsegmentationofmultipletargets]]
**A Stable Multi-Scale Kernel for Topological Machine Learning [#be903e5b]
-[[xiangze750>https://twitter.com/xiangze750]]
-http://www.slideshare.net/xiangze/stable-multi-scale-kernel-for-topological-machine-learning
**懇親会 [#o61ee0d7]
*[[第29回「有名論文を読む会」>http://kantocv.connpass.com/event/14485/]] [#gff87f3e]
-今回は有名論文を読む会
-会場は東大本郷キャンパス
**P-N Learning: Bootstrapping Binary Classifiers by Structural Constraints [#yd8771f7]
-takminさんによる発表
-スライドは[[こちら>http://www.slideshare.net/takmin/pn-learning-takmin]]
**Curriculum Learning [#k9c08039]
-losnuevetorosさんによる発表
-スライドは[[こちら>http://www.slideshare.net/YoshitakaUshiku/20150530-kantocv-curriculumlearning]]
**Selective Search for Object Recognition [#m2a9ec5b]
-sakanazensenさんによる発表
-D進どうですか!
-スライドは[[こちら>http://www.slideshare.net/belltailjp/kantocvselective-search-for-object-recoginition]]
**Learning to forget: Continual prediction with LSTM [#j1e8303c]
-peisukeさんによる発表
-出産、引っ越し明けでの発表ありがとうございました。
-スライドは[[こちら>http://www.slideshare.net/FujimotoKeisuke/learning-to-forget-continual-prediction-with-lstm]]
**Learning Bayesian network from data [#wbddee22]
-[[mabonki0725>https://twitter.com/mabonki0725]]さんによる発表でした
-ベイジアンネットワークは循環するループを作れない
**懇親会 [#zfe21b81]
-最中に地震が。
-物心つく頃にはデュアルコアだった人間が、何故かベーマガを知ってた
-学会で役立ちそうなネットワーク図があればいいな
-D進どうですか!
*[[第28回「5巻2章 複数画像からの三次元復元」>http://kantocv.connpass.com/event/12375/]] [#e0bc85f0]
-会場は東大本郷キャンパス
*[[第27回「コンピュータビジョンでこんなプログラム作りました大LT大会」>http://kantocv.connpass.com/event/10640/]] [#j421568d]
-今回は実装系メインの回。いつもと毛色の違うテーマのためか、半数近くが初参加の方でした。結局当日は10名に発表して頂きました。
-会場は東大生産研究所
-[[togetter>http://togetter.com/li/776655]]
**オープニングトーク [#n412a979]
-私が担当
**Deep Learningで物体検出 [#j0fdd736]
-[[takmin>https://twitter.com/takmin]]さんによる発表でした
-地雷が多かったという報告
-スライドは[[こちら>http://www.slideshare.net/takmin/20140131-r-cnn]]
**PyCPXによる峯岸みなみの認識 [#qd8b0def]
-[[jellied_unagi>https://twitter.com/jellied_unagi]]さんによる発表
-見事似た顔の中から峯岸みなみさんを認識してました
-事前検出で見落としてると、さすがに無理
-スライドは[[こちら>http://www.slideshare.net/yonetani/colmine]]
**最近の最近傍探索 PQと仲間達 [#cdc087d6]
-[[ketsumedo_yarou>https://twitter.com/ketsumedo_yarou]]さんによる発表
-PQはproduct quantization の略
-量子化することで、マッチング時の検索をLUTで高速に行えるという話
-スライドは[[こちら>http://www.slideshare.net/ketsumedo_yarou/presentation-for-web-44080684]]
**Caffeのデータレイヤで夢が広がる話 [#yebea8cb]
-[[rezoolab>https://twitter.com/rezoolab]]さんによる発表
-Caffeのデータレイヤを自前で実装
-博士課程で、そろそろ求職中とのことでした
-スライドは[[こちら>http://www.slideshare.net/takanoriogata1121/cv20150131]]
**Deep AKB48 [#f4a532d2]
-[[conta_>https://twitter.com/conta_]]さんによる発表
-サーバも立てて、そこに画像を放り込むと、AKBの誰だか認識するサービス
-半分仕事、半分趣味。良いですねー
-スライドは[[こちら>http://www.slideshare.net/takanoriogata1121/cv20150131]]
**OpenCV 便利Tips紹介 [#fc71b878]
-我らが[[dandelion1124>https://twitter.com/dandelion1124]]先生による発表
-OpenCLの自前カーネル
-メモリの使用量計測
-3.0から追加されるラベリング機能の紹介
-相変わらずテクい話ばかりでした
-スライドは[[こちら>http://www.slideshare.net/YasuhiroYoshimura/cv-dandelion1124-20150125]]
**色恒常性に基づく色補正ライブラリcolorcorrec [#h80c6b51]
-[[shunsukeaihara>https://twitter.com/shunsukeaihara]]さんによる発表でした
-初参加で初発表、ありがとうございました
-色補正colorcorrecのデモでは会場から「あーなるほどー」と納得の性能
-スライドは[[こちら>https://speakerdeck.com/shunsukeaihara/2015-01-31-kantocv27]]
**3D医用画像アプリを作った [#odf5bfeb]
-[[fofof>https://twitter.com/fofof]]さんによる発表
-医用画像は2次元でなく、3次元
-3次元だと、近傍が6近傍、18近傍、26近傍と、見慣れない数字になるなど、知らなかった世界を紹介してもらえました
-スライドは[[こちら>http://www.slideshare.net/fofof200/3-d-rev2]]
**スマートカメラ作ってみた [#y80da590]
-[[tabe2314>https://twitter.com/tabe2314]]さんによる発表でした
-リアルタイムで、しかも無線で動くJetsonTK1によるデモでした
-電源バッテリーとか、ネットワークも無線とか、格好良すぎる
**JetsonでOpenCV [#c851fdc2]
-最後は私の発表
-%%丸々ネタかぶり%%
-スライドは[[こちら>http://www.slideshare.net/tomoaki0705/jetsonopencv]]
**懇親会(新年会) [#e8d48162]
-下北沢で新年会
--おめでとう
--スカイネットは生まれるのか?
--次回どうするか
--などで盛り上がりました。

*[[第26回「番外編 ECCV2014読み会」>http://kantocv.connpass.com/event/9644/]] [#cb4aac56]
ECCV 2014 の読み回でした。会場は東大生産研究所。
**オープニングトーク [#tdced32e]
**Large-Scale Object Classification Using Label Relation Graph [#lc9ecb95]
-[[takmin>https://twitter.com/takmin]]さんの発表でした
-一般物体認識をする際に、属性の包含、排他関係を導入するお話
-属性は包含 ( puppy や husky は dog である ) と排他 (cat は dog ではなく、その逆もまた真)の2種類を定義
-それらを学習時に適用することで、矛盾する学習結果を弾いて精度を向上させるお話
-属性はHEXグラフで定義され、有向エッジと無向エッジで属性関係が表現される
-スライドは[[こちら>http://www.slideshare.net/takmin/ieee2014]]&note{slide-takmin-eccv-2014-cvsaisentan:[[Large-Scale Object Classification Using Label Relation Graphs>http://www.slideshare.net/takmin/ieee2014]], 2014-12-06公開, 2014-12-06閲覧};
**Face detection without bells and whistles [#g5635868]
-[[jellied_unagi>https://twitter.com/jellied_unagi]]さんの発表でした
-顔検出を地道に丁寧にやってみたら精度が上がったよ、という論文
-例えば、「誤検出」の定義や、そもそも学習データのアノテーションなどをもっと厳密に行った論文
--片目が少なくとも見えてないとダメとか、サイズが一定以上じゃないと学習に使わないとか
--そういった厳密なアノテーションをすることで精度が上がったというお話
-スライドは[[こちら>http://www.slideshare.net/yonetani/face-detection-without-bells-and-whistles]]&note{face-detection-without-bells-and-whistles:[[Face detection without bells and whistles 論文紹介>http://www.slideshare.net/yonetani/face-detection-without-bells-and-whistles]], 2014-12-04公開, 2014-12-06閲覧};
**Facial Landmark Detection by Deep Multi-task Learning [#sd999dd7]
-[[poyy>https://twitter.com/poyy]]さんの発表でした
-初発表ありがとうございます
-顔検出のタスクを、
--顔の特徴点5点の位置検出と
--顔の向き/メガネの有無/笑顔かどうか/性別の4つの補助Taskに分けた研究
-学習時に、補助Taskの過学習を防ぐ仕組みも導入
-これにより、精度よく学習が出来ましたというお話
-あくまで、特徴点5点(両目、口角、鼻の頂点)の位置検出がメインTaskという主張
-ライブデモもあり、会場は盛況でした。
-スライドは[[こちら>http://www.slideshare.net/ySasao/tcdcn-sasao-42348137]]&note{tcdcn-sasao-42348137:[[Introduction to "Facial Landmark Detection by Deep Multi-task Learnin…>http://www.slideshare.net/ySasao/tcdcn-sasao-42348137]], 2014-12-04発表, 2014-12-06閲覧};
**Blind Deblurring Using Internal Patch Recurrence [#y10b3bbd]
-tackson5さんの発表でした
-安定の会場大爆笑からスタート
-僕は大好きな発表です
-Deblur を行う研究
-Patch based なdeblur なのだが、Patch を推定する際に自己の画像を縮小した画像で行う研究
--自己の縮小画像でするので、recurrence
-Averageは、従来手法を凌駕こそしないものの、Worst case が改善されていて、よりロバストなdeblurだという研究
-発表スライドは[[こちら>http://www.slideshare.net/tackson5/cveccv2014-blind-deblurring-using-internal-patch-recurrence]]&note{cveccv2014-blind-deblurring-using-internal-patch-recurrence:[[関東CV勉強会ECCV2014 (Blind Deblurring using Internal Patch Recurrence)>http://www.slideshare.net/tackson5/cveccv2014-blind-deblurring-using-internal-patch-recurrence]], 2014-12-06公開, 2014-12-06閲覧};
**Part-based R-CNNs for Fine-grained Category Detection [#z45a0a4c]
-[[tabe2314>https://twitter.com/tabe2314/]]さんの発表でした
-CNN で鳥を認識する際に、鳥の目の位置、羽の位置などを学習データに盛り込むことで、高精度な認識を行う研究
-DPMと違い、あくまで全身に対するパーツの位置をGMMで表すことで精度が向上した研究
-また、並列でもう1本の手法を提案しており、そちらは、画像から似た鳥の画像をクエリし、その画像中の、頭の位置、胴体の位置などを制約として鳥の認識を行う
-一応鳥が主眼の研究だったが、鳥以外の動物でも当然うまくいきそう。
**懇親会(忘年会) [#pb7b1e56]
-12名も参加して頂いて盛況でした
-誰がリア充だ、誰が隠れリア充だ、という話が一部で盛り上がりました
-日本の小学校も二人がけの机にするべきだと思います
-今年もお疲れ様でした
**感想 [#f5239fa0]
-ECCVの論文を、皆様分かり易く解説して頂いて、感謝です。
-発表者の方も、ぜひとも臆せずに立候補してもらえれば幸いです
-2回連続で発表できてないので、次回は自分が立候補しようと思います

*[[第25回「番外編 3次元形状計測・認識」>http://kantocv.connpass.com/event/8082/]] [#hea2089b]
-仕事のために参加できず。無念!

*[[第24回「番外編 CVPR2014読み会 後編」>http://connpass.com/event/6772/]] [#va55dcfe]
CVPR 2014 の読み回(後編)でした。会場は東大生産研究所。
**オープニングトーク [#u7829bc2]
-今回は発表をする手前、私がオープニントークを担当しました
**DeepFace: Closing the Gap to Human-Level Performance in Face Verification [#b6cb10e8]
-[[私>http://twitter.com/tomoaki_teshima]]の発表でした。
-スライドは[[こちら>http://www.slideshare.net/tomoaki0705/cvim-saisentancvprdeep-face]]
-笑いが少なくて、理解度も足りなく、ちょっと反省

**Model Transport: Towards Scalable Transfer Learning on Manifolds [#ybccf9f2]
-発表は[[@_kohta>https://twitter.com/_kohta]]さん
-スライドは[[こちら>http://www.slideshare.net/kohta/model-transport-towards-scalable-transfer-learning-on-manifolds]]
-Lie群を直接学習する際に、パラメータがユークリッド空間にないから、一度変換してから学習するお話。
-転移学習
-例えば人間の格好を違う向きから撮影した画像だったり、体の大きさの変わり方なんかを多様体で表す。という発表。
-正直むずかしかった

**Face Alignment at 3000 FPS via Regressing Local Binary Features [#c5176ef0]
-発表は @tackson5さん
-スライドは[[こちら>http://www.slideshare.net/tackson5/cv20140802face-alignment-at-3000fps]]
-かわいい女の子が散りばめられていて、またドッキリも仕掛けられていて、私からすると理想的なスライドでした。

**Reconstructing storyline graphs for image recommendation from web community photos 他 [#rc78d831]
-発表は[[@_akisatoさん>https://twitter.com/_akisato]]
-スライドは[[こちら>http://www.slideshare.net/akisatokimura/cvpr2014-reading-reconstructing-storyline-graphs-for-image-recommendation-from-web-community-photos]]
-メインの論文と、その第一著者がシリーズでされている研究紹介でした
-発想が面白いけれど、「数値的、定量的な評価、検証が難しい」という印象
-それでも価値があると思わせる研究でした

**次回以降のネタについて [#f886132e]
-@takmin さんから、次回以降のネタについて、提案がありました
-9個ネタの提案をした上で、会場からの多数決で人気を取り、あとは幹事で相談して決めます。


**懇親会 [#gbb2cc06]
-懇親会も開きました。長かったので3行でまとめると
--エンジニアの教養として「ジョジョの奇妙な冒険」は必須
--スタンド使い(高専クラスタ)同士はひかれあう
--スティーリー・ダンはラバーズの本体名であって、ホイール・オブ・フォーチュンはズィー・ズィーの誤りでした。各位すいません

*[[第24回「番外編 CVPR2014読み会 前編」>http://connpass.com/event/6856/]] [#n7474348]
CVPR 2014 の読み回(前編)でした。会場は東大生産研究所。
**オープニングトーク [#dbc0b259]
**BING: BinarizedNormed Gradients for ObjectnessEstimation at 300fps [#x9036475]
-発表者:[[takmin>https://twitter.com/takmin]]さん
-スライドはこちら

**Inferring Unseen Views of People [#pc372910]
-発表者:[[jellied_unagi>https://twitter.com/jellied_unagi]]さん
-スライドはこちら

*[[第23回「6巻第4章 ディープ・ラーニング」>http://connpass.com/event/5936/]] [#hde3f483]
Deep Learning の回でした。会場は東大生産研究所。
**1 はじめに - 2.1 多層ニューラル [#y05e942b]
-発表者:[[tomoaki_teshima>https://twitter.com/tomoaki_teshima]]
-私の発表です。[[スライドはこちら>http://www.slideshare.net/tomoaki0705/cvim-saisentan64tomoaki]]
-導入部分だけなので、Deep Learning 自体は紹介してるに過ぎませんが、初心者にも分かり易い説明を心がけました。
***誤植や単語の使い方について [#t56e1e0c]
-発表中、及び発表後の議論で、
--資料内でNNおよびNeural Networkと指摘しているものはMLP(Multi Layer Perceptron:多層パーセプトロン)と呼ばれるものであって、MLPはNNの一部に過ぎない
--単語の誤植で、正しくはNeocognitronである
-というご指摘を頂きました。
-単語に関しての誤りは十分気をつけようと思います。ご指摘ありがとうございました。

***ミニバッチについて [#x097d9e9]
-ミニバッチは果たして
--過学習を抑える目的があるのか
--学習を早めに収束させるためなのか
-どちらなのか、という質問がありました。
-手島の解釈では、後者、だったのですが、議論の中では
--本来は、ランダムに選択することで、過学習を抑える効果も期待されるのではないか
--ランダムに選択するべきなのだが、学習データが十分揃っていれば、先頭から10個ずつ、みたいな入力をしても等価な効果が期待されるのではないか、
-という意見もありました。


**2.2 Convolutional Neural Network - 2.4 局所コントラスト正規化 [#je48a69f]
-発表者:[[hokkun_cv>https://twitter.com/hokkun_cv]]さん
-今回が初発表にして初参加。[[スライドはこちら>http://www.slideshare.net/hokutokagaya/convolutional-neural-network-cv-35089848]]
-CNNに関する説明をして頂きました。
-学部の卒論で食事画像の認識をされており、CNNも実際に利用されたそうです
-使うにあたって顕在化する問題点(パラメータがたくさんあることや画像の入力フォーマットが特殊だった)や世の中に生じやすい誤解(Pre-training と Deep Learning が混同されがち)など、一歩踏み入った目線での紹介がされました

**3 多層NNの教師なし学習 [#f71799e3]
-発表者:[[tabe2314>https://twitter.com/tabe2314]]さん
-今回が初発表。今回の教科書は元ボスと元同期が執筆されたそうです。
-[[スライドはこちら>http://www.slideshare.net/takashiabe338/auto-encoder20140526up]]
-オートエンコーダ、スパースな制約とスパースコーディング、Topographic ICAの詳細と、それぞれがどの様に寄与するのか、という説明を分かり易くして頂きました。
***CNNと脳の視野角について [#l3422bee]
-pre-training しなくて CNN がうまくいくのは、画像の限って言えば成り立つ話。
-画像じゃない場合は、学習がうまくいかない場合も多々ありうる。
-CNNと画像の組み合わせが良いのは、CNNの構造が脳の視野角のアーキテクチャに似てるからでは無いだろうか、という議論


**4 生成モデルに対するディープラーニング - 4.2 Restricted Boltzmann Machine [#u29b4443]
-発表者:[[jellied_unagi>https://twitter.com/jellied_unagi]]さん
-jellied_unagiさんは、今回から幹事も引き受けてくれた方です
-会場の手配、ありがとうございます。[[スライドはこちら>http://www.slideshare.net/yonetani/sec4-34880884?ref=http://connpass.com/event/5936/presentation/]]
-非常に難解な数式を丁寧に説明して頂きました。



**4.3 Deep Belief Network - 6 終わりに [#e64fe4e8]
-発表者:[[takmin>https://twitter.com/takmin]]さん
-幹事兼私の先輩でもあります。[[スライドはこちら>http://www.slideshare.net/takmin/deeplearning44-takmin]]
-ボルツマン、ボルツマンマシンのスライドで会場中爆笑でした

**感想、その他 [#g6c40040]
-難しかったです・・・
-久しぶりの発表だったので、緊張しました
-会場が今回から慶應矢上から東大駒場に移動になったので、個人的には超大歓迎でした。
-あと、今回幹事に参加表明をしたので、これから幹事としても頑張って行きます。

*第21回「ECCV2012読み会」 [#k710a80e]

*第19回「番外編 CVハッカソン」 [#f49c9568]

*第15回「3巻第4章 Bag-of-Featuresに基づく物体認識(2) -一般物体認識-」 [#s0f0d7a5]

*第10回「番外編 OpenCV祭り」 [#o00e9aeb]
-私の資料は[[こちら>http://www.slideshare.net/tomoaki0705/opencv-60432030]]
-Google Docs の資料はSlide Share に移動させました
*第9回「2巻第3章 カーネル情報処理入門」 [#c138e256]

*第3回「1巻第3章 パーティクルフィルタとその実装」 [#z41874d6]

*第2回「1巻第2章 グラフカット」 [#jf2c9330]

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS