どうも、カーブミラーです。
今回は、画像内の吹き出しを認識して、赤枠で囲みます。
本記事は、ChatGPT(有料版)
で行なっております。画像は
あります。 あしからず。
まずは、ニュースです。
OpenAIは
高額なサブスクリプションプランを
検討しているそうです。
ChatGPT研究所ポスト
GPT-Nextは
それだけ能力が
高いのでしょうね。
さて、本題です。
今回は、
画像内の吹き出しを
認識して、赤枠で囲みます。
ChatGPTに
ふつうに指示しても
それなりの位置や大きさで
赤枠を描いてくれます。
しかし、
確実な形を求めているのに
こんな精度では
いただけません。
なんとかできないかと
ずっとあれこれやってきました。
ようやく
形になりましたので
記事にしました。
今回使用したのはこちら。
DALL-E3で描いた画像です。
吹き出しがありますね。
これを認識してもらうわけです。
手順は
❶GPT-4oであることを確認
❷画像をアップロード
❸Prompt入力
OpenCVを使用して、画像内の白い領域を検出し、その領域を輪郭として抽出してください。その後、検出された白い領域の中から最も大きい矩形を特定し、その矩形の周りに赤い枠を描画してください。
❹送信
❺ダウンロードリンクが表示
ChatGPTさんに
このPromptの説明を
してもらいます。
ChatGPT
実施した手順:
- 白領域の検出: OpenCVを使用し、画像内の白い領域を検出。画像をグレースケールに変換し、しきい値を設定して白い部分を明確に区別しました。
- 輪郭検出: 検出した白い領域の輪郭を検出し、領域全体に多角形の赤枠を描画しました。
- 領域内の矩形検出: 検出された白い領域の中で、最も大きい矩形を特定し、その領域に赤い枠を描画しました。
- 最終調整: 輪郭の中から最大の領域を囲む矩形だけを描画し、最終結果として提示しました。
いやぁ、
長かったです(^_^;)qフキフキ
“手法を変える”ように
指示したことで、
うまく行きました。
これでようやく
次の段階に進めます。
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。