文章→イラスト生成AI
最近、マルチモーダルAIというのが流行っているようです。
特に、大規模言語モデルと拡散モデルを組み合わせた、文章からイラストを生成するモデルは、GoogleやOpenAI等が様々なAIを作って日進月歩の感があります。
そんな中、日本語で指示した文章から、イラストを生成するAIのデモンストレーションを作成しました(↓)
http://ailab.nama.ne.jp/#text2image
上のサイトにアクセスして、AIに描かせたいイラストの内容を指示すると、AIが何かを描いてくれます。
実行例
とりあえず簡単な例。
まぁまぁ文章から特徴を捉えてイラストを生成している事が解ります。
固有名詞はどうでしょう?
固有名詞や、複雑な形状をしている物体の場合、細部が歪んでしまいますが、何を描こうとしているのかはだいたい掴めます。
初音ミクさんは拡散モデル界隈にも名が知れているようですね。さすが。
そしてドナルドトランプの癖の強さよ。こういった固有名詞だと、学習データに含まれている欧米寄りのバイアスが如実に表れます。
しばらくデモンストレーションを動かしているので、興味のある方は遊んでみてくれればと。