読者です 読者をやめる 読者になる 読者になる

画像処理とか機械学習とか

画像処理や機械学習関連の事について気まぐれで書いていきます。歩行者検出関係が多いと思います。ハリネズミもたまに出現します。

【随時更新】歩行者検出の為のカスケード型検出器の学習(ICCV2015の論文読み)

今回はICCV2015の論文でまだ歩行者検出関係が有りますので読んでいきます。
カスケード型の識別器の学習の論文のようです.Deep Learningとも関係があるみたいで、Deep Modelの特徴をカスケード構造に組み込むようです。読みながらまとめていき、随時更新します。

 

参考論文:Learning Complexity-Aware Cascades for Deep Pedestrian Detection

http://www.cv-foundation.org/openaccess/content_iccv_2015/papers/Cai_Learning_Complexity-Aware_Cascades_ICCV_2015_paper.pdf

 

  • 概要

Complexity-aware cascaded detectorsという、複雑さが違った特徴量を組み合わせる構造が考えられた。

精度と複雑さの両方を考慮したリスクのラグランジュ最適化で学習を行う、新しいカスケードの設計手順が紹介された。
Complexity aware cascade training(CompACT)として示されたブースティングアルゴリズムは、この最適化を解くことで導き出される。

CompACTアルゴリズムは、カスケード構造の後半で特徴量を高次元へ射影することで精度と複雑さの間の最適なトレードオフを探す。

これは、検出器の中で非常に複雑な特徴量で利用が可能であるということを示している。結果として、特徴プールにCNNの出力のようなカスケード構造に利用するには実用的でないとされてきた特徴を使うことが出来るようになった。

CompACTカスケードは、CNNとシームレスに統合し、結果としてCaltechとKTTIデータセットで過去に提案されたものと比較しても、最も良い性能が出せ、かなり早い処理速度も実現している。

 

  • 関連研究と高速な人物検出

 人物検出は重要なタスクであり、多くの手法が存在し、リアルタイムでの動作が求められる。Sliding Windowの枠組みでは、640×480ピクセルの画像1枚から検出を行うのに、100万回計算を行うこともあり、かなり扱いづらい問題である事が分かる。
 人物検出の分野で、最新の手法としてDeep Learningを用いるDeep Modelsがある。また、高速な検出の手法としてカスケード構造が挙げられる。カスケード構造とはいくつかの識別の層を作り、初めの方の識別器は簡単な軽い計算の識別器を置き、徐々に後半の識別器になるにつれて厳しい判定の識別器を用いる手法である。このカスケード構造を取ることで、精度を落とすこと無く識別の計算コストを減らすことが出来る。