WEBCAMP ENGINEER COMMUNITY Advent Calendar 2022 17日目の記事になります!
はじめに
都内でWEBエンジニアをしているsf-12と申します。普段はVue.jsやRails、GCPを使って自社サービスを開発しています。
今回は、普段あまり触ることのないサービスに触れてみようと思い、VertexAIを触ってみました。
VertexAIとは
Google Cloud が提供している機械学習関連の統合プラットフォームです。
機械学習に使用するデータの収集や加工、モデルの作成や学習、テスト、デプロイなどを行うことができます。
作成するもの
画像に何が写っているか分類する機械学習モデルを作ってみようと思います。
画像データにはCIFAR-10と言われるデータを使用しました。
CIFAR-10は32x32ピクセルのカラー画像で、犬や猫などの10クラスの画像が6000枚ずつ用意されています。
今回はこのデータの中から、4種類(飛行機、自動車、猫、馬)の画像500枚ずつを使用し、それらを判別できるモデルを作成します。
手順
1.データを登録する
ダッシュボード画面
こちらがVertexAIのダッシュボード画面です。
まずはデータを登録するため、「トレーニングデータを準備する」のところの「データセットを作成」をクリックします。
データタイプと目標の選択
「データセット名」に適当な名前を入れつつ、データタイプと目標の選択をします。
今回は複数の種類の画像を分類できるようにしたいので「画像分類(マルチラベル)」を選択します。
「作成」ボタンを押すとデータセットが作成できます。
データセットに画像を追加
データのインポート方法は3つのうちから選べるみたいです。
今回は「パソコンから画像をアップロード」を選択しました。
「ファイルを選択」ボタンを押し、ひとまず飛行機の画像100枚をアップロードしてみます。
※ データが多いとアップロードに少し時間がかかるのですが、完了したらメールで通知してくれます。やさしい😊
2.データにラベルを付ける
飛行機の画像100枚をアップロードした結果です。
画像にはまだラベル(これが何の画像なのか、についての情報)が付いていないため、これから付与していきます。
画面中央やや左寄りのところに「新規ラベルを追加」というボタンがあるので、こちらをクリックします。
飛行機の画像に対してラベルをつけたいので、「airplane」と入力します。
「完了」ボタンを押すと、「新規ラベルを追加」ボタンの上に「airplane」というラベルが作られました。
まだこのラベルを付与している画像がないので、数が0と表示されているのがわかります。
すべて選択にチェックを入れて、
画面中央上にある「ラベルの割り当て」をクリックすると、右からラベル割り当てのナビゲーションが出てきます。
ここで「airplane」にチェックを入れて保存します。
これで画像に「airplane」ラベルをつけることができました!
「airplane」のラベルの数が100になったのが確認できます。
同じように画像データの登録とラベル付けを繰り返し、「airplane, automobile, cat, horse」のそれぞれ500データをラベル付けしました。
これでデータの準備は完了です!
3.モデルの作成と学習
新しいモデルのトレーニング
データの準備ができたので、機械学習モデルをトレーニングしていきます。
画面右側にある「新しいモデルのトレーニング」をクリック。
トレーニング方法
デフォルトの設定で「続行」を押しました。お好みで調整してください。
モデルの詳細
トレーニングオプション
説明可能性
こちらにチェックをつけると、どのような特徴が予測結果に影響するのか出力してくれます。余分にお金がかかるので今回はチェックなしにしました。
コンピューティングと料金
ここで、最大どれくらいトレーニングさせるかを指定します。入力できる最小値が8だったため、8にしています。
早期停止を有効にする、にチェックを入れておくと、モデルに改善の余地がなくなるまでトレーニングが済んだ場合に指定したノード時間よりも早く停止してくれるため、料金を節約できます。
ここまで設定したら「トレーニングを開始」ボタンでモデルのトレーニングが始まります。
トレーニング中
トレーニングが開始されると、ステータスが「トレーニング」になります。トレーニングには時間がかかるため、完了したときにメールで通知してくれます。
トレーニング結果
数時間後、トレーニングが終了して結果が表示されました。
適合率 90.2%となっているため、画像の90%を正しく予測できているようです。
4.モデルのデプロイ
作成したモデルを試すためにデプロイします。
「デプロイとテスト」タブを開いて、「エンドポイントにデプロイ」をクリック。
ナビゲーションの指示に従って必要事項を埋めていきます。
エンドポイントの定義が終わったら「続行」ボタンをクリック。
「モデル設定」についても項目を埋めていきます。
最後に「デプロイ」をクリック。
これでデプロイできました!
「画像のアップロード」ボタンを押すことで、モデルが予測結果を返してくれます。
予測してみる
いくつか画像をアップロードして、予測結果を確認してみます。
注意点として、ここでアップロードする画像はトレーニングで使用した画像とは別のものを用意します。
一度学習したことのある画像を使って予測させても、カンニングさせているような状態なのでちゃんと予測できているかわからないからです。
成功したケース
まずは、予測が成功しているケースからです。
airplaneが95%と予測しています。当たっていますね!個人的には自動車と飛行機の判別で迷うのかなと思っていたのですが、airplaneの次に数値が高いのがcat1.6%だったのが意外です。
もはや人間の目で見ても猫なのかどうか怪しい画像ですが、きちんと判別できています。
人間が一緒に写っているみたいですが、ちゃんと馬だと認識できていました。
どれも正しく予測できてますね!
失敗したケース
予測が失敗してしまったケースについてもご紹介します。
こちらは飛行機なのですが馬と間違えています。飛行機の画像は背景が空の場合が多いのですが、この画像は背景が地面なので、判別が難しかったものと思われます。
これは猫なのですが、馬と間違えています。おそらく靴の爪先に猫がじゃれている画像なのですが、爪先と猫を一体として捉えて馬と判別しているものと思われます。
こちらは自動車なのですが飛行機と間違えています。背景が空色なので、飛行機と判別してしまったものと思われます。
所感
VertexAIでは難しい知識なしに指示に従うだけて機械学習モデルを作成することができました。各ラベルのデータが500枚だと少ないかと思っていたのですが、想定以上に高性能のモデルを作ることができて驚いています。今回はお試しでモデルを作成して精度を検証するだけでしたが、Webサービスに組み込めば面白いサービスが色々作れそうなので次回があればチャレンジしてみようと思いました。