0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【ChatGPT+Code Interpreter】で画像内の吹き出しを認識して、赤枠で囲みます。

Last updated at Posted at 2024-09-06

 どうも、カーブミラーです。

 今回は、画像内の吹き出しを認識して、赤枠で囲みます。

本記事は、ChatGPT(有料版)
で行なっております。画像は
あります。 あしからず。

 まずは、ニュースです。

 OpenAIは
  高額なサブスクリプションプランを
   検討しているそうです。
    ChatGPT研究所ポスト

 GPT-Nextは
  それだけ能力が
   高いのでしょうね。


 さて、本題です。

 今回は、
  画像内の吹き出しを
   認識して、赤枠で囲みます。

 ChatGPTに
  ふつうに指示しても
   それなりの位置や大きさで
    赤枠を描いてくれます。

 しかし、
  確実な形を求めているのに
   こんな精度では
    いただけません。

 なんとかできないかと
  ずっとあれこれやってきました。

 ようやく
  形になりましたので
   記事にしました。

 今回使用したのはこちら。
  DALL-E3で描いた画像です。
   吹き出しがありますね。
    これを認識してもらうわけです。
1725593863061.jpg

 手順は
 ❶GPT-4oであることを確認
 ❷画像をアップロード
 ❸Prompt入力

吹き出しに赤枠Prompt
OpenCVを使用して、画像内の白い領域を検出し、その領域を輪郭として抽出してください。その後、検出された白い領域の中から最も大きい矩形を特定し、その矩形の周りに赤い枠を描画してください。

 ❹送信
 ❺ダウンロードリンクが表示

 これで作成されたのがこちら。
1725593883868.jpg

 ChatGPTさんに
  このPromptの説明を
   してもらいます。


ChatGPT

実施した手順:

  1. 白領域の検出: OpenCVを使用し、画像内の白い領域を検出。画像をグレースケールに変換し、しきい値を設定して白い部分を明確に区別しました。
  2. 輪郭検出: 検出した白い領域の輪郭を検出し、領域全体に多角形の赤枠を描画しました。
  3. 領域内の矩形検出: 検出された白い領域の中で、最も大きい矩形を特定し、その領域に赤い枠を描画しました。
  4. 最終調整: 輪郭の中から最大の領域を囲む矩形だけを描画し、最終結果として提示しました。

 いやぁ、
  長かったです(^_^;)qフキフキ

 “手法を変える”ように
  指示したことで、
   うまく行きました。

 これでようやく
  次の段階に進めます。

 みなさんの
  作品制作の糧に
   なれば、幸いです。

 今回は、ここまで。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?