先日の記事で紹介した本「Machine Learning for Vision-Based Motion Analysis: Theory and Techniques」もそうですが、一昔前のビジョンではあまり積極的には使われていなかった機械学習の各最先端アルゴリズムも、ビジョン分野において高度なところまで使われることが当たり前になってきましたね。日本人の方にとってはこれらが英語の本やWebリソースばかりなので、日本語で書かれた本やサイトがもっと欲しいところでしょうか。一方で、機械学習ばかりに偏ると、計測寄りのビジョン技術がおろそかになりかねないので極端なのも良くはないのでしょうが。
Toyota Technological Institute at ChicagoのRaquel Urtasun先生が、今度のCVPR2012に合わせて公開するデータセットを紹介します(※私のラボのドクターの方が聴きにいった、先日行われたUrtasun先生の東大でのセミナーの内容を受けて本記事を書いています。あらためて情報感謝です)。
今回紹介するのはKarlsruhe Institute of Technologyによる、以下の「KITTI Vision Benchmark Suite」というデータセットです。
Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite Andreas Geiger and Philip Lenz (Karlsruhe Institute of Technology), Raquel Urtasun(Toyota Technological Institute at Chicago)
A Generative Model for 3D Urban Scene Understanding from Movable Platforms (CVPR2011): 道路の3D幾何+位相の確率モデルのMCMCサンプリングによる推定。
Joint 3D Estimation of Objects and Scene Layout (NIPS2011) :シーン認識側にVanishingPointとシーンラベル(建物、道路、空の3クラス)を観測情報として加え、また車両位置の検出も用いることで「物体検出+シーンモデル生成」に発展させたもの。(※ 講演でUrtasun先生は「Vanishing Pointだけで結構できる。でも、この(ゴールデンデータ)動画ほど毎回うまく行くというわけではない」とおっしゃっていたそうです。)