どうも、カーブミラーです。
今回は、画像の吹き出しに日本語を入れます
本記事は、ChatGPT(有料版)
で行なっております。画像は
あります。 あしからず。
まずは、ニュースです。
画像生成AIの
NijiJourneyのアニメスタイルに
パーソナライゼーション機能が
追加されました。
Midjourney公式ポスト
ようは、
固定のキャラを
何度でも描ける、って機能です。
たぶん(←使わないから😅)
X-Twitter界隈では
“すごい(本当だ)”というよろこびと
“全然ダメ”という言葉が
見受けられていますね。
さて、本題です。
今回は、
画像の吹き出しに
日本語を入れます。
DALL-E3では
吹き出しに英語は
入れられます。
(崩れたりしますけど)
でも日本語は
入れられず、
やろうとしても
ハングルっぽいとか
漢字?みたいなものに
なってしまいます。
そこで
Code Interpreterで
入れてやればいいのでは?と
考えたわけです。
画像の上に
文章を重ねることは
以前にやりましたね。
【ChatGPT+Code Interpreter】で画像にテキストを書き込みます。
ですが
吹き出しに
文章を重ねるには
その位置を指定しなければ
なりません。
何かのツールを
使えば、座標や範囲を
得られはしますが、
Code Interpreterに
そのデータを手入力するのは
手間ですよね。
そこで
昨日(2024/09/06)の記事の内容を
使うわけです。
【ChatGPT+Code Interpreter】で画像内の吹き出しを認識して、赤枠で囲みます。
昨日の記事により、
位置と範囲がわかります。
あとは、その中に
文章を重ねるだけです。
では、はじめましょう。
ここでは
昨日の元画像を
使います。
また、日本語を使うので
その点の注意も必要です。
ようはフォントをアップロードが
必要だということです。
今回は
元画像とともにフォントも
アップロードしますが、
これは別々でも構いません。
その際は、
フォント、元画像の順で
お願いします。
手順は
❶GPT-4oであることを確認
❷日本語フォントと元画像を
アップロード
❸Prompt入力
・今後、CodeInterpreterではこのフォントを使用してください。
・OpenCVを使用して、画像内の白い領域を検出し、その領域を輪郭として抽出してください。その後、検出された白い領域の中から最も大きい矩形を特定し、その矩形の中に、“好き”と描画してください。
・ダウンロードリンクを示してください。
❹送信
❺ダウンロードリンクが表示
ごらんのように
Promptでは位置も範囲も
指定していません。
ここまで長かった😭
みなさんの
作品制作の糧に
なれば、幸いです。
今回は、ここまで。