Google Labs「Mixboard」とは?
タイトルの「AIシステム開発」からちょっと離れた感じになってきてますが、ボスからの指令を分業化、多様化して進めていくうえで、僕は今後、画像・クリエイティブ関係の情報をメインに書いていこうかと思います。
さて、今回の「Mixboard」は、Googleが提供する、画像とテキストを使ってアイデアを拡張したりまとめたりするためのAI搭載コンセプトボード。最初は米国だけの提供でしたが最近は日本でも利用可能になりました。普通にLLMで画像生成することとは違った使い方ができるかという視点でも試してみました。
Mixboard主要機能
Google公式の説明では、Mixboardでできることは大きく次の通り。
- テキストプロンプト or 既存テンプレからプロジェクト開始
- 手持ち画像の持ち込み、またはAIで画像生成
- 自然言語で編集(変更・合成など)
画像編集モデル Nano Banana を使用 (proではないっぽい) - ワンクリックでバリエーション生成
- 画像に落書き+指示で、編集範囲をコントロール
- PDF対応、ボード内での「自撮り」画像の追加
- ボード内容を スライド(プレゼン)へ自動変換
- 1プロジェクト内で 複数ボードを運用できる
※生成上限はサーバー負荷などで変動しうる、という注意書きも公式にあります。
実際にやってみる
- Mixboardを開いて「New project」
- まずは テーマを入力(ボードゲームカフェにありそうな小物、家具などを生成して)

↓

一発でめっちゃ出てくる。ブラウザLLMでやると基本一枚ずつなので便利。 - 出てきたボードから好みのものを残し、気になる案は「more like this」で増やす

上の黒いバーの左から2番目で「こんな感じのもの」を気軽に増やせる。左端も似たような挙動。真ん中はコピペ。 - 合成や小変更は自然言語で編集可能(Nano Banana)

散らかった部屋をブラウザGeminiから生成してもらった。これを片付けたい。…のだが…

エンジンがnanobananaのproではないせいかわりとポンコツで、言うことを聞いてくれないことが多い。その場合は… - 画面に描いて編集範囲をコントロール


画面指示とテキスト指示の両方をやると成功しやすい。この辺はちょっと面倒なのでバージョンアップに期待したいところ。それはともかく、ブラウザLLM上と比較すると編集対象を選択した画像に紐づけることが簡単なのでやりやすいと言える。 - 合成

ドラッグで視覚的に画像群を囲み、合成する。ブラウザLLMでの生成よりもずっと簡単にできる。

選択した要素全てが反映されているわけではないが、これはすごい。

選択する画像を変えていろいろバリエーションが作れる。 - 他者と共有

右上の「share」で他者に見せられる。クライアントとのイメージのすり合わせなどに便利そう。 - スライドショーにする
shareの横の「Presentation」でスライドにできる。(これはNanobananaProを使っているっぽい)今回は物語性のある作業ではないのであまりピンとこないのだが一応作ってもらった。

1でフォーマットを選び、2にプロンプトを書き、3でテイストを選ぶ。ちなみにこの画像上に入力されているプロンプトは僕が考えたものではなく、Mixboard側が自動で作ったもの。

結果はこんな感じ。20分くらいかかった。
まとめ・LLMでの通常画像生成と比較した優位性
- 一括で大量に作れる
- 編集対象を紐づけしやすい
- 複数合成などが楽
- バリエーション生成などが楽
- ボード共有でクライアント等とのイメージ共有が楽
- スライドにできる
このあたりだろうか。上でも述べたが編集機能がポンコツなのが難点だが改善に期待したい。エンジニアにも役立ちそうなサービスだと思うので参考までに。