Deep Researchが無料開放されたらしい
Googleさんがとち狂ってGeminiのDeep Researchを無料ユーザーにも開放したらしい。僕はPhalanXwareの一員として有料版を使わせてもらってるのですが、このAI覇権争いによる恩恵は大変ありがたいですね。まあもちろん使用回数制限があるようなので、月5回分をどこで使うかは迷いどころ。ラストエリクサー症候群に陥らないように、使ってみた感じをお伝えしたいと思います。
使い方
左上のGeminiタイトルをクリックしてDeep Researchをクリックするとチェックが移ります。
テーマ
Pythonの機械学習でGPUを使えるようにするやり方がなかなか難しかったので、これについて聞いてみました。
「リサーチを開始」をクリックで開始。(画像は押した後なので変わっているが押す前は青色のボタン)押すと数分かけて50以上のサイトをリサーチしてくれます。
結果
結果はこちら。
こちらの記事にもあるように、Windows環境ではTensorFlowのバージョン2.11以降はGPU使用がサポートされなくなっているのですが、この情報もきっちり補足されています。普通にググった場合はまあまあたどり着くのに時間がかかり、ChatGPT 4oに聞いても教えてくれない情報だったと記憶しております。その、Windows環境でTensorFlow 2.11以降をインストールした場合の解決法も聞いてみました。
左側のチャットでいろいろ教えてもらったので、見やすいように右側に表示されている最初のレポートにまとめてもらいました。
おもしれー!じゃあ二つめ行ってみよう、と今度は機械学習のテクニックについて質問してみたのですが以下の画面から変わらず。おや…?
どうやら5回分使ってしまったっぽい?左のチャットでの追加質問や「まとめてくれ」といった要求も1回にカウントされる可能性がある…?あちゃー。ラストエリクサーを知らずにがぶ飲みしてしまってたようです。もったいねえ。みなさん気を付けましょうね…。
結論
めっちゃ使えるが、無駄撃ちに気を付けましょう。通常のLLM(課金版)でも初手ではたどり着けない情報を拾ってくれるのはさすが。無駄撃ちを避けるためには日頃から聞いてみたいことをメモっておくといいかもしれません(…って結局すごいアナログな作業だな。)
Google AI Studioを使ってみた
これまでの画像生成AIでは出てきた画像を調整していく過程で同一性を保つのが難しかったのだが、Google AI Studioの画像生成AIではかなり同一性を保持してやってくれるらしい。というわけでデザインに使う素材を作ってみた。
左上のボタンでAPIキーを作成すると使えるようになる。
プロンプト→「桜吹雪のシルエットを白地に黒で描いてください」
いい感じだが枝が邪魔。白地に黒でもない。
「黒い枝が邪魔なので消してください。」
枝じゃなくて桜が消えている。逆!
「逆です。枝が残っています。桜吹雪だけ描画してください。」
枝は消えたが桜吹雪は前の感じのほうがよかった。
「花びらの大きさにメリハリをつけてください」
なぜかグリーンバックに。花びらも小さすぎる。
「花びらを全体的に大きくしてください。」
復ッ活ッ!枝、復活ッッ!!いやなんでだよ。要らないって。花びらにメリハリもついてない。最初はできてたのに…。数値で要求してみるか。
「枝はいらないので消してください。花びらの全体20%ほどを3倍くらいに大きくしてください」
なぜか白黒反転。要求も全然通ってない。
「枝がまだ残っています。消してください。花びらをもっともっと大きくしてください。」
要求が全く通らず、なぜかまたグリーンバックに。枝、しぶといな。
もういい!俺にはChatGPT大先生しかない。画像生成機能がアップグレードされた?と今日Xでトレンド入りしてたので、そっちでもやってみた。
「桜吹雪のシルエットを白バックに黒で描いてください。」
枝と花は要らないので消し、あと分布が規則的すぎる。
「枝と、5枚揃った花びらは消して、散り方を自然でランダムな分布にしてください。」
枝は消えたが花びらの間隔がきっちりソーシャルディスタンスを取っている。
「分布が規則的すぎるのでもっと粗密にメリハリをつけてください。花びらの大小にもメリハリをつけてください。写実的なシルエットにして下さい。」
「もっと無数に舞っている感じにしてください。密集しているところとまばらなところがあるようにしてください。花びらの形にもパースをつけてください。」
全然ダメだな…ちょっと指示の方向性を変えてみるか
「もっとカオスな感じ、自然界の一コマを切り取ったような写実的な感じにしてください。」
気持ちわる!
うーん。まあGoogleAIくんに比べると要求は守ってくれているが、意図したものにはならない感じ。
結論
まだまだアホの子。AIで8割作って残り2割を人間がやるべき、みたいなことはよく言われるが、デザインはまだまだ5割以上は人間がやらないといけない分野かも。人物の写真を読み込ませて、服装を変えたりするのは得意らしいので用途によるかなあ。
今回はこんな感じで。システム開発のほうはFletでChatGPTのAPIを叩いてあれこれするアプリを作っているがあんまり進んでない。為替予想プログラムはかなり改良されてきていて、検証上では月利5%くらいを出せる計算だが実地ではなかなかそう上手くはいかず…という状況です。ではまた次回。