はじめに
Nano Bananaというものがあるらしいと聞いてぺーぺー初心者が触ってみました。
期待と実際
日本語描写が改善されている、という情報を知っていたのでうまく出力されることを期待しました。
実際に試すとうまくいきませんでしたがこれは単語で指示だしをしてしまったことに由来するのではと考えました
やったこと
異なる2単語を生成
Geminiを開き、ツールを「🍌Create images(画像を作成)」に選択、
モデルメニューから「Thinking(思考モード)」を選択して以下のプロンプトを入力しました。
「以下単語の画像を生成して「月明かりのラーメン」」
画像を生成
コレクション感覚でみてね
月明かりのラーメン
古代の扇風機
憂鬱なカンガルー
沈黙スパイス
無限クリップ
真夜中水族館
爆発図書館
虹色借用書
未来漬物
透明ライオン
画像生成は「単語」より「文章」が効く
素人でもわかる、このAI感はなんだ
他の人のプロンプトを見ると文章で背景や状況を具体的に指示を出している。英語だと尚よさそう。
真似してみよう
短い文章にしてみた。
未来漬物が自分の中では振るっていないのでもう一度試してみた。
「未来漬物」この単語にインスパイアされた商品を描いてください。実際にフランスのマルシェで売られている状態にしてください
こちら↓の記事を参考にさせていただきました。
Nano bananaのすべて
短い文章にすると改善した点
・日本語
・AIっぽさが多少なくなり、現実と非現実を融合させた感じになった
どんなオブジェクトにしたいか、どんなゴールを目指すか、どの程度の具体性が効果的かを測るのが初心者には難しいなあと思いました。。
終わりに
画像生成って単語ではなく、具体的な指示を文章で与えればその能力が発揮されるものだと改めて理解しました。
チグハグの中でもお気に入りの一個を生み出せたらなんか嬉しい。
個人的には古代の扇風機が結構好み。
偶然性を強めたい場合は、今回のような単語で指示の一部をあえて緩くするのはよさそうである。
逆に安定性を強めたい場合は、具体的な条件を複数入れる。
うまくゲームにできたら面白いかも?指示出しゲームとか
蛇足ですがQiitaに生成した画像をそのまま埋め込もうと思ったらなぜか埋め込めなかった。高解像度すぎた?画像サイズを小さくすれば埋め込めた。












