1
3

5行で作る画像認識AI - Google Colab × TensorFlowで簡単実装

Last updated at Posted at 2024-07-27

はじめに

こんにちは!今回は、わずか5行のコードで画像認識AIを作る方法をご紹介します。Google ColabとTensorFlowを使用するので、環境構築の手間もなく、誰でも簡単に試すことができます。

image.png

準備

  1. Google Colabにアクセスし、新しいノートブックを作成します。
  2. 負荷状況によっては、ランタイムのタイプをGPUなどに変更してください(編集 > ノートブックの設定 > ハードウェアアクセラレータ)。

コード

以下の5行のコードをノートブックに貼り付けて実行するだけです!

import tensorflow as tf
from tensorflow.keras.applications.inception_v3 import InceptionV3, preprocess_input, decode_predictions
model = InceptionV3(weights='imagenet')
img = tf.keras.preprocessing.image.load_img('画像のパス', target_size=(299, 299))
print(decode_predictions(model.predict(preprocess_input(tf.keras.preprocessing.image.img_to_array(img)[None, ...])), top=3))

image.png
犬の画像を指定したところ、Pomeranian(ポメラニアン)と認識できた

解説

1行目:TensorFlowをインポートします。
2行目:InceptionV3モデルと関連する関数をインポートします。
3行目:事前学習済みのInceptionV3モデルを読み込みます。
4行目:画像を読み込み、モデルの入力サイズに合わせてリサイズします。
5行目:画像を前処理し、モデルで予測を行い、結果を表示します。

使い方

4行目の '画像のパス' の部分を、実際に分類したい画像のパスに置き換えてください。例えば:

img = tf.keras.preprocessing.image.load_img('/content/cat.jpg', target_size=(299, 299))

認識できる画像の例

InceptionV3モデルは多様な画像を認識できます。以下に、認識可能な画像の例をいくつか挙げます:

  1. 動物:犬、猫、象、キリン、鳥など
  2. 乗り物:車、自転車、飛行機、船など
  3. 食べ物:ピザ、ハンバーガー、寿司、フルーツなど
  4. スポーツ用品:サッカーボール、テニスラケット、スキー板など
  5. 電子機器:スマートフォン、ノートパソコン、テレビなど
  6. 自然風景:山、海、森、砂漠など
  7. 建築物:家、高層ビル、橋、神社など
  8. 日用品:椅子、テーブル、ベッド、時計など

これらは一例で、実際にはImageNetデータセットに含まれる1000種類以上のカテゴリを認識できます。

注意点

  • インターネット接続が必要です。
  • 初回実行時は、モデルのダウンロードに時間がかかる場合があります。
  • 画像は、アップロードしてそのパスを指定してください。サイズを調整してください。
  • モデルの認識精度は画像の品質や角度、照明条件などに影響されます。

まとめ

たった5行のコードで、最先端の画像認識AIを使用することができました。この手法を応用すれば、さまざまな画像分類タスクに活用できるでしょう。ぜひ、自分で撮影した画像や興味のある画像で試してみてください!

image.png

参考情報

  1. TensorFlow公式ドキュメント: https://www.tensorflow.org/

    • TensorFlowの基本的な使い方や機能について詳しく解説されています。
  2. Keras Applications: https://keras.io/api/applications/

    • InceptionV3を含む、様々な事前学習済みモデルについての情報が得られます。
  3. ImageNet: https://www.image-net.org/

    • InceptionV3モデルの学習に使用されたデータセットについて知ることができます。
  4. Google Colab公式サイト: https://colab.research.google.com/

    • Google Colabの使い方や機能について詳しく解説されています。
  5. 「Convolutional Neural Networks for Visual Recognition」Stanford CS231n: http://cs231n.stanford.edu/

    • 畳み込みニューラルネットワークと画像認識について深く学びたい方におすすめです。

これらのリソースを参考にすることで、画像認識AIについてさらに理解を深めることができます。技術の進歩は日々目覚ましいので、最新の情報もチェックしてみてください。Happy coding!

1
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
3