前回こちらでセットアップしたDetectNetを使って、いくつかの画像から物体検出をしてみました。
デフォルトのSSD-Mobilenet-v2の学習済みモデルをそのまま使っています。こちらに、検出可能なクラスが掲載されています。
https://github.com/dusty-nv/jetson-inference/blob/master/data/networks/ssd_coco_labels.txt
こちらにpythonのサンプルプログラムが置かれているので、
https://github.com/dusty-nv/jetson-inference/tree/master/python/examples
こちらをダウンロードして、以下の通り入出力を指定して上げるだけで、学習済みのモデルで推論実行が可能です。
python3 detectnet.py input.jpg output.jpg
動物
物、乗り物系
小さ目の飛行機も認識しています。
人物+α
2人乗り自転車も自転車として認識。顔が傘で隠れた画像も傘と人両方認識しました。スキー場の小さな人も認識しています。
動画もやってみたら、エラー。
[gstreamer] gstDecoder -- failed to discover stream info
[gstreamer] gstDecoder -- try manually setting the codec with the --input-codec option
[gstreamer] gstDecoder -- failed to create decoder for file:///home/nakachan8019/myData/tmp/MOV_0015.mp4
Segmentation fault (コアダンプ)
H.264の動画なので、コーデックの指定でH.264を指定したら動作しました。こちらはちょっと検出精度がもう一歩という感じかな。
python3 detectnet.py input.mp4 output.mp4 --input-codec=h264
最後に、象さん、認識できるかな?と思ったら、学習対象になってなかった・・・
バナナ。(・。・)