画像処理とか機械学習とか

画像処理や機械学習関連の事について気まぐれで書いていきます。歩行者検出関係が多いと思います。ハリネズミもたまに出現します。

Caltech Pedestrian Dataset の使い方

 コンピュータービジョンの分野における近年の歩行者検出は、Deep Learningを用いる手法が主流となってきている。それに伴って、非常に多くの学習画像が必要となっています。Caltech Pedestrian Dataset は近年の歩行者検出で用いられる学習データの中でも非常に多くのデータとannotation(ラベル付け)がされており、近年の研究では特に利用されているデータセットです。

 

Caltech Pedestrian Datasetは、圧縮された動画ファイルとアノテーションファイル、そして大きな学会で発表された歩行者検出の結果をDETカーブで表示するための実験結果・グラフ化のソースコードまで付属しています。

また、動画にアノテーションを付ける為のソフトも一緒についており、学習データを自作することも可能です。

つまり、Caltechのデータセットを使うと、学習データが簡単に作成出来るだけではなく、現在の先進的な研究との性能を簡単に比較することが出来ます。

 

 

  • ダウンロード方法

 以下のリンク先からダウンロードすることが出来ます。

Index of /Image_Datasets/CaltechPedestrians/datasets/USA

 

f:id:hiro2o2:20160204134925p:plain

リンクを開くと上の様な画面が開きます。

set00.tar ~set10.tarが圧縮された動画のデータになります。

開くにはMatlab用のソースコードが必要です。

Matlab用のソースコードは、以下のリンクの下で示した画像の部分でダウンロードできます。

 

www.vision.caltech.edu

 

f:id:hiro2o2:20160204135333p:plain

 

また、Matlabソースコードを使用するために、Piotr's Matlab Toolboxというものもダウンロードする必要があります。これは以下のリンクよりダウンロードします。

Piotr's Matlab Toolbox

 

設定の仕方は、ダウンロード後解凍し

>> addpath(genpath('toolboxまでのパス')); savepath;

>> toolboxCompile;

と実行すればokです。

 

データセットMatlabコードのダウンロードが終了後、Matlabのコードのディレクトリの方へデータセットを移す必要が有ります。

ディレクトリは以下の画像のように配置して下さい。

 

matlabコードのディレクトリでdata-USAを作成

f:id:hiro2o2:20160204140512p:plain

 

data-USA内は以下のようになります。

annotationsはダウンロードしてきたものをそのまま入れます。

imagesは、matlabコードのdbExtractを実行すると自動的に作成されます。

 

新しく作成するのは、resとvideosです。

resの中には実験結果のデータがannotationsと同様にダウンロードできるので、解凍したものをそのまま入れます。

また、videosには、ダウンロードしてきたset00~set10までを解凍したフォルダごと入れて下さい。

f:id:hiro2o2:20160204140514p:plain

 

ここまで終わると、準備完了です。

dbEvalを実行すると、以下の様なDETカーブが表示されるはずです。

f:id:hiro2o2:20160204141003p:plain

 

次回はその他のMatlabコードの使い方を説明したいと思います。