はじめに (本記事は 2021年7月 のものです)
Google Cloudには「AutoML Vision」というCloud上の画像認識ソフトがあります。
プログラミングしなくても、簡単に画像の機械学習ができるツールがあり、今回は自分自身で「カスタムモデル」を作成する手順をご紹介したいと思います。
なお、今回のトライアルでは、「Google Cloudの無償トライアル(300$)」を利用して実施しております。
本トライアルで課金されることはありませんが、無償トライアルのクレジットを無駄に消費しないよう注意点がいくつかございますので、しっかりと確認の上実施してください。
特に作成したモデルをデプロイしたままでいると、1時間ごとにずっと課金され続け、1ヶ月で合計9万円ほど課金されるので十分注意してください。
事前準備
「AutoML Vision」を利用する事前準備として、以下の手順がございます。
- Googleアカウント(Gmailアドレス)の準備
- 「Google Cloudの無償トライアル(300$)」の申請
こちらについては以下のサイトを参考にしてください。
Google Cloud: 無償トライアルの申請
今回作成するモデルに関して
今回は 「AutoML Vision」 の「画像分類」機能を利用して、「フライドチキン」か「トイプードル」を見分ける分析を実施してみたいと思います。
Googleサイトなどの検索サイトを利用するなどして、それぞれ15枚以上の「フライドチキン」と「トイプードル」写真を入手してください。(モデルを作成するためには最低10枚の画像が必要となります)
【Googleを利用した検索方法】
Googleの場合は、「Images」をタブを利用すると簡単に収集できます。
以下のフォルダ構成のように、学習させたいデータをそれぞれ画像の種類ごとにフォルダへ保管し、「半角英数字」のファイル名をつけて、ZIPファイルにしておきます。なお、フォルダ名がクラスタリングするときの「ラベル名」 になります。
以下の例では、dataフォルダの中に、「FriedChiken」と「ToyPoodle」のフォルダを作成し、それぞれのフォルダの中に学習用の画像ファイルを入れてあります。「FriedChiken」と「ToyPoodle」がラベルになります。
$ tree data
data <--- アップロードするデータ保管用フォルダ(ここからzipファイルにする)
├── FriedChiken <--- ラベル名
│ ├── 10.southern-fried-chicken.jpg
│ ├── 11.368790_fried-chicken_1x1.jpg
│ ├── 12.keto-fried-chicken-18-480x270.jpg
│ ├── xxxxx
│
└── ToyPoodle <--- ラベル名
├── 1.il_fullxfull.1418065203_sb3x.jpg
├── 10.652918064014365.jpg
├── 11.Red-Toy-Poodle-HP-long.jpg
├── 12.poodle-no-discoloration.jpg
├── xxxxx
「AutoML」サービスの有効化と「AutoMLVision」の開始
1. Google Cloudのダッシュボードから以下の手順で、AutoMLの画面を選択。
これで「AutoML Vision」を利用する準備が整いました。
ここまでの操作で特に課金されることはございません。
学習用データ(データセット)のアップロード
1. データセットの作成
「新しいデータセット」のボタンをクリックして、適当な名前をつけ、今回利用するサービス「マルチラベル分類」を選択して、データセットの作成をクリックします
2. パソコンからファイルをアップロードを実施して、続行をクリック
(なお、③のドライブの指定手順は下の方に示す)
③のドライブの選択方法は以下の通り。
③-1: バケットを作成をクリック
③-2: バケット名を適当に付与して、保存場所は「Region」を選択
③-3: Googleが管理する暗号鍵を選択して、作成
3. ラベリングされたことを確認
ポータル画面にて、写真がアップロードされ、ラベリングされて登録されたことを確認します。
「Fried Chicken」をクリックしてフィルタリングすると、「Fried Chicken」でラベリングされた写真が表示されます。
トレーニングを実施
1.トレーニングのタブを選択し、「トレーニング開始」をクリックします
2. モデル名を適当に付与
3. ノード時間に最小の「8」を入力し、トレーニングを開始をクリック
※このとき、「トレーニング後にモデルを1ノードにデプロイする」にはチェックをいれないこと。
デプロイした場合、このデプロイを削除しないと、1時間あたり 1.5ドル くらい(1ヶ月で900ドル)くらい課金されます。
*なお、この段階で誤ってチェックを入れても、モデル作成後に削除することは可能です。
モデル作成が完了すると、登録したGmailのアドレスにメールが飛んできます。
今回の学習(2ラベル、120枚)くらいで、だいたい30分くらい掛かりました。
4. モデル評価
モデル作成後に、「評価」のタブをクリックすると、今回のモデルの品質が表示されます。それぞれどんな意味があるかは調べてみてください。
モデルの実行
それでは、今回作成したモデルをデプロイして、分類できるか試してみたいと思います。
1.「テストと使用」タブから、モデルを作成します。
デプロイするのに、10分くらい掛かるかもしれません。
2.モデルが作成された後に、ファイルをアップロードします。
10枚のファイルまで選択することが可能です。
3.結果の確認
そうすると、分析され結果が表示されます。うまく判別できているでしょうか??
以上となります。非常に簡単に画像分類処理ができることが確認できました。
検証がおわったら、「デプロイメントの削除」処理を行ってください。
作業が完了したら、「デプロイメントの削除」(デプロイしたモデルの削除)を実施すること
検証がおわったら、必ず「デプロイメントの削除」を実施してください。
このデプロイを削除しないと、1時間あたり 1.5ドル くらい(1ヶ月で900ドル)くらい課金されます。
AutoML課金の注意点
AutoML Vision(画像分類)には2種類の課金がございます。
- モデルを作成する課金
- モデルをデプロイして利用する際の実行環境(サーバ)に対する課金
1. モデルを作成する課金について
画像データを利用して、モデルを構築する場合にその掛かった時間に対して課金されます。
ただし、最小でも「8ノード時間」が課金され、だいたい25ドル課金されます。
・(1 ノード時間あたり 3.15ドル)×(8 ノード時間)= 25.20ドル
多くの場合、試験運用モデルの構築には 8 ノード時間(「実時間」で約 1 時間)あれば十分です。ただし、写真のデータ枚数やラベル数に異存しますのでご注意ください。
無償枠で作成できるモデル数は、後述しております。
2. モデルをデプロイして利用する際の実行環境(サーバ)に対する課金
モデルを利用する際は、そのモデルをサーバにデプロイして利用する必要があります。
一回モデルをデプロイすれば、その「利用回数」に対して課金はされませんが、モデルがデプロイされたサーバに対して時間課金されます。
従って、モデルを利用して検証する間のみ、サーバにデプロイして作業を実施し、作業が完了したら必ず削除する必要があります。
ちなみに、モデルをサーバ上にデプロイし、1時間の間検証を実施し、最後モデルを削除した場合の利用金は「1.25ドル」になります。
・(1 ノード時間あたり 1.25ドル)×(1 ノード)×(1.0 時間)= 1.24ドル
非常に小さな金額ですが、1ヶ月の間起動したままの状態ですと、「900ドルくらい」になります。
・(1 ノード時間あたり 1.25ドル)×(1 ノード)×(1 日 24 時間)×(30 日)= USD 900ドル(デプロイとオンライン予測)
十分にご注意ください。
無料プログラムで利用できる検証回数(推定)
AUTOML VISIONには、最初の利用開始時に、トレーニングとオンライン予測それぞれに 「40 時間の無料ノード時間(一年間有効)」が提供されます。
従って、「オンライン予測」については、きちんと利用していない時に削除できていれば、この無償枠で全て賄うことができると考えられます。
トレーニングについては、「1回 8ノード時間」が掛かる想定で考えると、無償枠で「5回」、更に300ドルの無償プログラムで「11回分(= 25.20ドルx11回)」で、合計「15回」モデルが作成できると考えられます。
ぜひうまく無償キャンペーンを利用して検証してください。