AutoML VisionでFIFAのプレイ画像を識別する

Last updated at 2019-10-23Posted at 2019-04-07

やってることを３行で

AutoML Visionを使えば自分が持つラベルつき画像を学習させて、個別の画像認識問題を解けるようになる
ローカルPCの画像やGCSに溜めているFIFAのプレイ画像をAutoML Visionに食わせてラベルをつけた
極めて少ないサンプルでもインプレイ画像とハイライトや得点シーンなどのアウトオブプレイ画像をちゃんと識別してくれている(勿論、問題設定によってはサンプルが重要なこともある)

AutoML Visionとは

公式リファレンスによると

Cloud AutoML は機械学習プロダクトのスイートです。AutoML を利用すると、機械学習の専門知識があまりない開発者でも Google の最先端の転移学習とニューラルアーキテクチャ検索技術を利用して、ビジネスニーズに合った高品質のモデルをトレーニングできます。

機械学習プロダクトのスイートってなんや？

要はこういうことかと。。

Cloud AutoML Visionが機械学習モデルをトレーニングして、自分の定義したラベルに従って画像を分類可能
自分で画像認用のモデルをゴリゴリ作成する必要がないので、統計や深層学習の知識は不要（しかし、２値・多値分類の評価方法ぐらいは知っておく必要がある）
ただし本格的に導入しようとしたらそれなりにお金が掛かるので資金はあるが技術がない人には最適

AutoMLでFIFAの画像を分類する

以前に単純な機械学習のアルゴリズムでFIFAのプレイ動画のシーンを識別してプレイ部分だけを再編集した動画を生成できるか検証したが、今回はAutoML Visionを使って同じようにシチュエーションの異なるシーンを識別できるか検証する

Qiita: 機械学習を使ってゲーム動画からプレイシーンだけを抽出出来るか検証する。ちなみにだいたい出来た。

1.GCSにプレイ画像のキャプチャをUploadする

自分のPCから直接画像ファイルをあげることもできるが、GCS（GoogleCloudStorage）からもUploadできるので、AutoMLのデータインポート画面で提示されているgs://{自分のPJのパス}の配下に画像ファイルを格納しておく

2.AutoMLにGCS(or ローカルPC)から画像をUploadする

AutoMLに対して画像をUploadする方法は、主に２つ

自身のPCにある画像を直接Uploadする
Upload対象のGCSに格納してある画像ファイルを指定したCSVファイルを読み込ませてUploadする

パッと試したければ自身のPCから直接画像をあげるのでいいと思うが、APIの活用を視野に入れる場合は２の方法も検討した方が良い

しかも、２の場合には画像のPATHを指定したCSVファイルにラベルを事前につけておくことが出来るので、画面上でラベリングを後でしなくても良いため結局楽かも。。。

csvはこんな感じで用意する

sample.csv


# gcsのファイルパス,ラベル
gs://{sample.csvと同一バケット}/inplay/fifa_cap_0001.png,inplay
gs://{sample.csvと同一バケット}/inplay/fifa_cap_0002.png,inplay
gs://{sample.csvと同一バケット}/inplay/fifa_cap_0003.png,outplay
gs://{sample.csvと同一バケット}/inplay/fifa_cap_0004.png,setting

*画像のパスを記載したCSVファイルと同じバケットに画像ファイルを置いておく必要があるので注意

そしてGCSを利用する場合は、事前にAutoMLがGCSに対してアクセスできるようにAPIを有効にしておく必要がある

*詳しくはクイックスタートのページを参照