さくらインターネットの提供する高火力DOKは、GPU上でDockerコンテナを実行するサービスです。V100またはH100のGPUが選択でき、実行時間に応じて秒単位の課金で利用できます。
今回はこの高火力DOK上で、ComfyUIを実行してみました。画像や動画生成モデルをGUIで組み立てられるので、色々と模索しながら各種メディアを生成するのに便利です。
ComfyUIとは
ComfyUIは、Stable DiffusionやVAE、LoRAをGUIで操作するためのソフトウェアです。ノードベースのUIで、条件を組み合わせながら画像や動画、音声などのメディアを生成できます。
ComfyUI | Generate video, images, 3D, audio with AI
立ち上げる
DOKのタスク新規登録にて、以下のように指定して実行します。
項目 | 値 |
---|---|
イメージ | yanwk/comfyui-boot:cu124-slim |
ポート | 8188 |
パス | / |
環境変数 | CLI_ARGS = --listen 0.0.0.0 --output-directory /opt/artifact |
今回は v100-32gb
で実行していますが、よりメモリが必要な場合には h100-80gb
を選択してください。
実行してタスクの状態が 実行中
になったら、 HTTP URL
の詳細ボタンをクリックします。そうするとURLが選択、表示できるようになります。
モデルをダウンロード
ComfyUIではさまざまなタスクが行えますが、今回は画像生成を選択しています。
初期状態のComfyUIでは、モデルがダウンロードされていないので、モデルをダウンロードします。これは右上にあるManagerから行います。
モデルは自由に選択できますが、まずはTypeを checkpoint
のものを選択してください。今回は stable-diffusion-xl-refiner-1.0
を選択しました。
ダウンロードが完了すると、デフォルトのノードでチェックポイントとして指定できます。
実行
準備が終わったら、下にある「実行する」ボタンをクリックします。画像が生成されると、右側にある「画像を保存」ノードのところに画像が表示されます。
条件(プロンプトなど)を変えて、色々試してみてください。画像は右クリックして保存できます。
終了時
ComfyUIを使い終わったら、必ずDOKのタスクを終了してください。終了しないと、課金が継続されてしまいます。
終了すると、ComfyUIで作成した画像が アーティファクト
セクションにある ダウンロード
ボタンからダウンロードできます。
ファイルは tag.gz 形式なので、注意してください(Windowsだと7-Zipとか必要かも知れません)。
まとめ
ComfyUIを使うと、手軽にStable Diffusionの画像を生成でき、条件をさまざまに試せます。できあがった条件はダウンロードしておくことができるので、次回利用したり、更にComfyUIのAPIを使った自動操作なども行えます。
画像生成、動画生成を行う際に、高火力DOKとComfyUIを組み合わせてみてください。