Caltech Pedestrian Dataset の使い方
- Caltech Pedestrian Datasetとは
コンピュータービジョンの分野における近年の歩行者検出は、Deep Learningを用いる手法が主流となってきている。それに伴って、非常に多くの学習画像が必要となっています。Caltech Pedestrian Dataset は近年の歩行者検出で用いられる学習データの中でも非常に多くのデータとannotation(ラベル付け)がされており、近年の研究では特に利用されているデータセットです。
Caltech Pedestrian Datasetは、圧縮された動画ファイルとアノテーションファイル、そして大きな学会で発表された歩行者検出の結果をDETカーブで表示するための実験結果・グラフ化のソースコードまで付属しています。
また、動画にアノテーションを付ける為のソフトも一緒についており、学習データを自作することも可能です。
つまり、Caltechのデータセットを使うと、学習データが簡単に作成出来るだけではなく、現在の先進的な研究との性能を簡単に比較することが出来ます。
- ダウンロード方法
以下のリンク先からダウンロードすることが出来ます。
Index of /Image_Datasets/CaltechPedestrians/datasets/USA
リンクを開くと上の様な画面が開きます。
set00.tar ~set10.tarが圧縮された動画のデータになります。
Matlab用のソースコードは、以下のリンクの下で示した画像の部分でダウンロードできます。
また、Matlabのソースコードを使用するために、Piotr's Matlab Toolboxというものもダウンロードする必要があります。これは以下のリンクよりダウンロードします。
設定の仕方は、ダウンロード後解凍し
>> addpath(genpath('toolboxまでのパス')); savepath;
>> toolboxCompile;
と実行すればokです。
データセットとMatlabコードのダウンロードが終了後、Matlabのコードのディレクトリの方へデータセットを移す必要が有ります。
ディレクトリは以下の画像のように配置して下さい。
matlabコードのディレクトリでdata-USAを作成
data-USA内は以下のようになります。
annotationsはダウンロードしてきたものをそのまま入れます。
imagesは、matlabコードのdbExtractを実行すると自動的に作成されます。
新しく作成するのは、resとvideosです。
resの中には実験結果のデータがannotationsと同様にダウンロードできるので、解凍したものをそのまま入れます。
また、videosには、ダウンロードしてきたset00~set10までを解凍したフォルダごと入れて下さい。
ここまで終わると、準備完了です。
dbEvalを実行すると、以下の様なDETカーブが表示されるはずです。
次回はその他のMatlabコードの使い方を説明したいと思います。