概要
唐揚げとトイプードルを見間違えた経験はありませんか?
今回はSONYの Neural Network Console を使って、唐揚げとトイプードルを判別するAIを作成する方法をご紹介します!
概要
この記事では以下の内容をカバーします:
- データセットの準備方法
- Neural Network Consoleでのモデル構築
- モデルのトレーニングと評価
- 判別AIの実行と結果の確認
1. データセットの準備
まずはAIをトレーニングするためのデータセットを用意します。
画像データの収集
今回はGoogleで唐揚げとトイプードルを検索を行い、それぞれの画像データを20枚ずつ収集します。
フォルダ構成
以下のように画像をフォルダに整理してください:
dataset/
├── 0/ # トイプードルの画像を保存
│ ├── img1.jpg
│ ├── img2.jpg
├── 1/ # 唐揚げの画像を保存
│ ├── img1.jpg
│ ├── img2.jpg
注意点
- 各フォルダに最低でも10枚以上の画像を用意してください。多いほど精度が上がります
- 画像サイズがバラバラでも大丈夫です。Neural Network Console側で画像サイズをトリミングしたり、
2. データセットの登録
- Neural Network Consoleを起動します。
2.まずはメニューバー右側にある「プロジェクトに名前を付けて保存」からプロジェクトの名前を保存します。それから 左メニューの「Dataset」タブをクリックします。
今回は画像分類を行うので、「画像分類」を選択します。
2. 新しいウィンドウが開いたら、事前に用意した dataset/ フォルダを選択してください。
フォルダ内には複数の画像が含まれており、各フォルダがクラス(カテゴリ)を表しています。例えば、トイプードルの画像は「0」、唐揚げの画像は「1」というように、自動的にラベル分けされます。
データセットをAIが効率よく扱えるように以下の前処理を行います:
- 画像サイズの統一: サイズが異なる画像を、中心部分を切り抜いてトリミングし、50×50ピクセルにリサイズします。
- 画像の色設定: 画像をカラー(RGB形式)として処理します。
これにより、モデルの学習が効率的になり、構築時間を短縮できることがあります。
また、データセットは以下の割合で分割します:
- 訓練データ (Training Data): 全体の80%を使用
- テストデータ (Test Data): 残りの20%を使用
2. Neural Network Consoleでのモデル構築
モデル構築
- 以下の構成でネットワークを組みます:
RGB画像を入力として、2クラス分類を行う単純な畳み込みニューラルネットワーク (CNN) です。畳み込み + プーリング層で特徴を抽出し、全結合層 + ソフトマックスで分類タスクを行っています。
- 画像データの形状は(3, 50, 50)
- チャンネル数 (3): RGB画像を表す3つのカラーチャンネル。
- 高さと幅 (50×50): 入力画像のサイズ。
他の設定
他にもメニューバー右上にある「コンフィグ」を選択し、以下のように設定します。
学習の実行
「Run」ボタンをクリックして学習を開始します。
進行状況がグラフとして表示されるので、精度と損失の変化を確認することができます。
評価の実行(モデルの評価)
テストデータを使ってモデルを評価します。
Confusion Matrix(混同行列) を確認し、唐揚げとトイプードルの分類精度をチェックします。
「混合行列」のタブを選択すると、評価データセットの分類精度やモデルの評価を行うことができます。
検証データの分類精度は、71.4 %程度にとどまりました。
おわりに
今回はSony Neural Network Consoleを用いて唐揚げとトイプードルの画像を判別する画像分類モデルを作成しました。人間でも見間違えそうな画像はまだまだ分類が難しいことがわかりました。ただ、学習枚数が多ければ当然分類精度があがるといえるでしょう。次回はカメラで撮像した画像を用いてモデルを構築したいと思います。