ComfyUIで生成したpngから、WorkFlowを復元するPythonコードをGPT4の手助けで即席に作れたよ
ComfyUIでSDXLで画像を生成したい
👇SDXLで生成
StableDiffusionのためのWebuiでの画像生成環境であるAUTOMATIC1111は、最近世に出たSDの高画質版のSDXLで画像生成できるにはできるのだが、まだ、refinerなどに対応していないため、久しぶりにComFyUIにもどって使っていたのところ、生成したpng画像をドロップするだけで、生成した時のプロンプトを復元できるAUTOMATIC1111のような機能がないので、不便だなーと思いながら、色々調べていたら、
cibitai.comのtoolのところで SD Image Infoというウェブアプリを見つけた。
(👇やこの記事で触れたコードがなくてもConfiUI内にpng画像をドロップすれば、WorkFlowが復元します)
しかし、これは画像をよそのクラウドにアップロードしなければならないので、ローカルでできるように
するため、pngの中のテキストファイルを抜き出すコードを自分で書こうと思ったが、以前C++でpngファイル
をごにょごにょするコードを書いたことがあったので、それを引っ張りだして眺めていたが、buildの環境
を整えるのがめんどうなので、GPT4+コードインタープリターでなんとかならないものかと、試してみた。
GPT4+コードインタープリターは頼りになる助手
GPT4がpngファイルの扱い方をどれくらいわかっているか試しているうち、一発でテキストを抜き出す
コードを作ってもらうのは無理そうということがわかったので(tEXtチャンクが無いとか言ってくる)、
ネットのpngコードを処理を処理するコードをアップロードし、
「これを参考にして、pngから、workflow(json)を抜き出すコードを書いて」と依頼したところ、わりとすんなり書いてくれた。しかし、細かい問題があったので、多少手直して、使えるコードができた。
以下のようなお願いをしたのだが、英語がテキトーなのはご容赦を.....
コード->https://github.com/ultrahamlet/png2ComFyUI_WorkFlow.git