#stub

複数枚の画像から,各座標における最頻値を計算する方法. 主に,固定カメラで撮影されたビデオシーケンスから背景画像を計算する方法

CvSparseMat* cvCreateSparseMat(int dimensions, const int* sizes, int type)

疎な多次元行列CvSparseMat型を生成する.画像におけるcvCreateImage,(密な)行列におけるcvCreateMat.

引数

  • dimensions:int型の次元数
  • sizes:各次元の長さを格納したint型の配列
  • type:int型のtype.cvCreateMatと同じ

返り値

  • 生成されたCvSparseMat型のポインタ

サンプルコード

  1. // RGBの3次元分.各色は0-255の値をとるので,各次元の大きさを256に設定.
  2. int dimensionSize[]            = {256, 256, 256};
  3. const int NUMBER_OF_DIMENSIONS = 3;
  4. IplImage *image                = cvLoadImage(inputFileName[0]);
  5.  
  6. /*---生成---*/
  7. // ヒストグラムの集合をnewで生成
  8. CvSparseMat **histogram = new CvSparseMat* [image->width*image->height];
  9. for(int i = 0;i < image->width*image->height;i++){
  10.     // ピクセルごとにヒストグラム用のCvSparseMatを作成
  11.     // typeがCV_16UC1なので,カウントは2byte=65536回までカウント可能
  12.     histogram[i] = cvCreateSparseMat(NUMBER_OF_DIMENSIONS, dimensionSize, CV_16UC1);
  13. }
  14.  
  15.  
  16. // 入力画像と同じサイズの画像を用意
  17. IplImage *background = cvCloneImage(image);
  18. cvReleaseImage(&image);
  19.  
  20. for(int frame = 0;frame < FRAME_LENGTH;frame++){
  21.     image = cvLoadImage(inputFileName[frame]);
  22.  
  23.     /*---データ格納 ---*/
  24.     for(int y = 0;y < image->height;y++){
  25.     for(int x = 0;x < image->width;x++){
  26.         // RGBの値を取得
  27.         CvScalar color = cvGet2D(image, y, x);
  28.  
  29.         // RGBによる3次元座標を構築してdimensionSizeに格納
  30.         for(int i = 0;i < NUMBER_OF_DIMENSIONS;i++){
  31.             dimensionSize[i] = color.val[i];
  32.         }
  33.  
  34.         // dimensionSizeで指定した座標(色)が過去何回現れたか取得
  35.         // 1度も現れてない場合は0が返される
  36.         CvScalar count = cvGetND(histogram[y*image->width+x], dimensionSize);
  37.         // カウントアップ
  38.         count.val[0]++;
  39.         // 格納する
  40.         cvSetND(histogram[y*image->width+x], dimensionSize, count);
  41.     }
  42.     }
  43.  
  44.     cvReleaseImage(&image);
  45. }
  46.  
  47. for(int y = 0;y < image->height;y++){
  48. for(int x = 0;x < image->width;x++){
  49.     // 内部のリスト構造のデータを手繰るためのイタレータ
  50.     CvSparseMatIterator mat_iterator;
  51.     // 初期化と同時に先頭ノードを返す関数
  52.     // 各ピクセルごとに先頭ノードを得る
  53.     CvSparseNode *node  = cvInitSparseMatIterator(histogram[y*image->width+x], &mat_iterator);
  54.     CvSparseNode *head  = node;
  55.  
  56.     /*---リストを連結---*/
  57.     for(;node != 0;node->next != NULL){
  58.         // 疎行列内はリストが連結してるとは限らないので,
  59.         // GetNextSparseNodeを使って次ノードを手繰る.
  60.         node->next = cvGetNextSparseNode(&mat_iterator);
  61.     }
  62.  
  63.     /*---ソーティング---*/
  64.     // リスト構造をソーティングする関数を別途定義しておくこと
  65.     // ここではマージソートを想定
  66.     // headノードが指す番地は最頻値になる
  67.     sort(head);
  68.  
  69.     /*---最頻値画像---*/
  70.     // 最頻値を取得
  71.     // 疎行列内の特定の座標の値を取得するdefine文 CV_NODE_VAL
  72.     // unsigned int count = *(unsigned int*)CV_NODE_VAL(histogram[i], node);
  73.     // 疎行列内の座標(この場合は色)を取得するdefine文 CV_NODE_IDX
  74.     const int* index = CV_NODE_IDX(histogram[y*image->width+x], head);
  75.  
  76.     CvScalar color;
  77.     for(int i = 0;i < NUMBER_OF_DIMENSIONS;i++){
  78.         color.val[i] = index[i];
  79.     }
  80.     cvSet2D(background, y, x, color);
  81. }
  82. }
  83.  
  84. /*---解放---*/
  85. for(int i = 0;i < image->width*image->height;i++){
  86.     cvReleaseSparseMat(&histogram[i]);
  87. }
  88. delete [] histogram;

解説

  • RGBで最頻値を作る場合,1ピクセル分のヒストグラムを作るだけで256*256*256≒16MBも必要とする
  • QVGAの分だけヒストグラムを用意すると256*256*256*320*240=1200GB(≒1.2TB)必要となる.
  • しかし,実際ヒストグラムの殆どはゼロである.
  • 存在した色の分だけメモリを確保することで,メモリの使用量を減らす
  • よって疎な行列CvSparseMatを用いる

生成

  • OpenCVにおける画像や行列と同じく,ポインタに対して領域を確保する関数(この場合はcvCreateSparseMat)を呼ぶ
  • このプログラムでは各ピクセルごとにヒストグラムを作るのでピクセル数分CvSparseMat*を用意する

データ格納

  • cvGetNDを使ってある色が過去に何回現れたか確認する
  • 何回現れたかを取得する場合,多次元配列中の座標をint型の配列で渡す
  • cvGetNDは一度も現れてない場合,0を返す.
  • cvSetNDを使ってカウントアップした値を書き戻す

リストを連結

  • CvSparseMat内のノードは,全部連結されてる訳でなく,内部でブツ切れになっている
  • 全ノードを連結させるために,cvGetNextSparseNodeを使う

ソーティング

  • リストを使ったソーティングなので,マージソートとかがお勧め.
  • そのうち中身を書きます.

最頻値画像

  • 配列内の値は「出現回数」
  • 最頻値は,ヒストグラム内で最大の値が存在する座標(色)
  • CV_NODE_IDXを使って,色を取得する
  • CV_NODE_IDXはcxtypes.h内でdefineされている
    1. #define CV_NODE_VAL(mat,node)   ((void*)((uchar*)(node) + (mat)->valoffset))
    2. #define CV_NODE_IDX(mat,node)   ((int*)((uchar*)(node) + (mat)->idxoffset))

解放

  • 他の構造体と同じくcvReleaseする必要がある
  • 内部のリスト構造を書き換えてしまったので,cvReleaseされるのか少し不安だったが,とりあえず問題なさそう.
  • 未検証

メモリ使用量

  • 画像サイズと観測するデータの枚数にもよるけれど,結局メモリ使用量が数百MB-1GBに達してしまい,1ピクセルごとにソーティングするより増えてしまう
    • 1ピクセル分のヒストグラムを作るのには256*256*256=16MB必要
    • 50枚のQVGA画像を蓄積するのに320*240*3*50≒11MB必要
  • と言うわけで,もっとメモリを削減したい場合は一旦メモリに格納して1ピクセル毎に最頻値を取得するべし
  • ちなみに,道路画像のように彩度の低い画像で試したときは,RGBのヒストグラムを作るより,X,Y,R,G,Bの5次元ヒストグラムを作って一発ソーティングした方がメモリ使用量が少なかった.

実体ファイル

  • src/cxcore/cxarray.cpp
  • include/opencv/cxtypes.h

ジャンル:OpenCV:OpenCV 2.1準拠


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-01-17 (月) 12:37:32 (2499d)