0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

画像説明ツールを作ってみた

Posted at

PythonとOpenAI APIを使った画像説明ツールの作成

はじめに

こんにちは、王です。
約2か月前から Python の学習を始め、最近 OpenAI の API を利用する機会があったため、
両者を組み合わせて簡単なデモツールを作成してみました。

今回は、その概要と実装内容について簡単にまとめます。


作成したものについて

Python と OpenAI API を利用し、
画像を入力すると、その内容を日本語で説明するツールを作成しました。

主に以下の情報を自動生成できます。

  • 画像の内容説明
  • タイトル
  • 関連タグ
  • 利用シーンの提案(SNS / EC など)

技術構成

今回使用した技術要素は以下の通りです。

  • Python
  • OpenAI API
  • 画像入力
  • プロンプトによる指示文

OpenAI の API Key は公式サイトから取得可能で、
API の利用方法やサンプルコード、開発ドキュメントも充実しています。


実装概要

コードは事前に GitHub にアップロードしています。
詳細な実装については、そちらをご参照ください。
https://github.com/Wang-Yuyao/pythonExercise
実装手順としては、以下の流れになります。

  1. OpenAI の Python パッケージをインストール
  2. 画像ファイルを base64 形式に変換
  3. 画像とプロンプトを OpenAI API に送信
  4. API から返却されたレスポンスを出力

作成したデモパターン

今回の画像分析デモでは、以下の 4つのパターン を作成しました。

  • 単一画像の分析
  • 複数画像の一括分析
  • SNS / EC 向け文章生成
  • アクセシビリティ支援(視覚障害者向け画像説明)

それぞれの用途に応じて、プロンプトを個別に作成しています。


実行結果について

実際に実行すると、
事前に設定したプロンプトに基づいた内容が出力されます。

  1. 下記のような画像を用意しました。
    image.png

  2. 画像のアドレスをプログラムに入力すること。

  3. API から返ってきたレスポンスをそのまま出力する
    7b034503b4916dd63757ea0fefbdae0d.png

プロンプトの書き方によって、
出力結果の粒度や表現が変わる点が印象的でした。


取り組んでみた感想

非常にシンプルなツールではありますが、
今回学習した Python と AI を組み合わせて、
実際に動くものを作ることができました。

Python 学習のアウトプットとして、
またマルチモーダル AI の理解を深めるきっかけになったと感じています。


今後やりたいこと

今後は以下のような点にも取り組んでみたいと考えています。

  • Web UI(Streamlit 等)での可視化
  • 出力フォーマットの整理

おわりに

今回はPython や AI 活用に興味を持つきっかけになれば幸いです。

最後までお読みいただき、ありがとうございました。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?