AIを利用したサービスは技術は具体的な仕組みの話が多く専門家以外はなかなか理解しにくいところもあるため、一般利用できる画像生成ツールに関して自分用に整理します。
画像生成AIとは
入力されたテキストをAIが解釈して新しい画像を作成したり、既存の画像や動画の画風を異なる画風に変更するような技術を指し、一般向けに公開されているツールもある。これにより、今までデザイナーではなかった人も望む画像を作成できるようになった。
ツール一覧
ツール | 利用方法 | アカウント登録 | 準備 | 課金 | 商用利用 |
---|---|---|---|---|---|
Stable Diffusion | オープンソース | 必要 | 必要 | - | ○ |
DALL・E 2 | ブラウザ | 必要 | - | - | ○ |
Midjourney | Discord | 必要 | 必要 | 無料版は利用上限あり | 有償のみ可 |
Imagen | 利用不可 | 利用不可 | 利用不可 | 利用不可 | 利用不可 |
Craiyon | ブラウザ | - | - | - | × |
各ツールについて
stable Diffusion
Stability AIが開発したオープンソース。オープンソースのため、セットアップを行えば実機でも利用でき、商用利用も可能。Linna社より日本語版も公開されている(GitHub - Colaboratory)
- セットアップ手順
DALL・E 2
Open AIがリリースした画像生成サービス。招待制となっており、利用するためにはウェイティングリストに登録して順番待ちをする必要がある。クレジット制となっており、時点で50回分の画像作成が可能。毎月15回分のクレジットが発行され、追加購入も可能。また商用利用も可能。
Midjourney
Discordサーバ上で誰でも試せる画像生成ツール。Discordのアカウントを登録すればだれでも利用可能で、1アカウントで25枚までの画像生成を無料で試せる。有料プランの場合は、月額料金に応じて月毎の利用回数が決められており、商用利用も可能。基本は英語で、日本語も利用可能だが精度は落ちるとのこと。
- セットアップ手順や料金について
Imagen
Googleがリリースした画像生成システム。あえて不適切データも含めて訓練しているため、一般公開していないとのこと。
Craiyon
OpenAIのDALL・Eをオープンソースのモデルで再現したもの。英語のみ認識する。
プロンプトエンジニアリングについて
画像生成AIの発展に伴い、プロンプトエンジニアリングという概念が生まれた。プロンプトエンジニアリングとは人工知能の思考を人間が助けるための手法を指す。例えば、画像生成AIへの入力テキストも、AIが解釈しやすい文章を打ち込むことでより望む画像を生成しやすくなる。
DALL・E2向けにプロンプトエンジニアリング用の資料が公開されている。