画像説明ツールを作ってみた

Posted at 2026-01-18

PythonとOpenAI APIを使った画像説明ツールの作成

こんにちは、王です。
約2か月前から Python の学習を始め、最近 OpenAI の API を利用する機会があったため、
両者を組み合わせて簡単なデモツールを作成してみました。

今回は、その概要と実装内容について簡単にまとめます。

Python と OpenAI API を利用し、
画像を入力すると、その内容を日本語で説明するツールを作成しました。

主に以下の情報を自動生成できます。

今回使用した技術要素は以下の通りです。

OpenAI の API Key は公式サイトから取得可能で、
API の利用方法やサンプルコード、開発ドキュメントも充実しています。

コードは事前に GitHub にアップロードしています。
詳細な実装については、そちらをご参照ください。
https://github.com/Wang-Yuyao/pythonExercise
実装手順としては、以下の流れになります。

今回の画像分析デモでは、以下の 4つのパターン を作成しました。

それぞれの用途に応じて、プロンプトを個別に作成しています。

実際に実行すると、
事前に設定したプロンプトに基づいた内容が出力されます。

プロンプトの書き方によって、
出力結果の粒度や表現が変わる点が印象的でした。

非常にシンプルなツールではありますが、
今回学習した Python と AI を組み合わせて、
実際に動くものを作ることができました。

Python 学習のアウトプットとして、
またマルチモーダル AI の理解を深めるきっかけになったと感じています。

今後は以下のような点にも取り組んでみたいと考えています。

今回はPython や AI 活用に興味を持つきっかけになれば幸いです。

最後までお読みいただき、ありがとうございました。