概要
Google CloudやGeminiについてのカンファレンス。
東京ビッグサイトにて開催。1日目のみ参加した。
今年は南棟のため、結構歩かされる。
展示ブース EXPO
1階は展示メイン。
Google公式ブースとスポンサーブースが混ぜこぜとなっているため注意して回る必要がある。
ブロックビルドゲーム
レゴの構造物のGeminiによる評価点を競うというもの。

「斬新なサボテン」という題目で作ったもの。色合い的に斬新さが足りなかったのか、他の方が勝利した。
プロンプトチャレンジ
特定のタスクに対するプロンプト力を評価するというもの。
今回は、不良品の謝罪と返品案内を行うメールを作成するものであった。
ランクは同着3位で、スコアを伸ばすには細かなニュアンスをプロンプトに盛り込んだ方が良いとのこと。


セッション
Day1 基調講演
新たなサービス名の紹介と実デモの紹介。
Agent Development Kit
AIエージェントを作るための開発フレームワーク。MCPにも対応。
Agent2Agent Protocol
AIエージェント同士がやり取りできるようにする枠組み。マルチエージェントシステム。
AIサービス群
・Gemini = LLM
・Imagen = 画像
・Veo3 = 動画、開始フレームと終了フレームを画像指定して決められる。カメラ操作の概念が加わった。
・Lyria 2 = 音楽
・Chirp 3 = ナレーション
デモ
Agent Spaceというエージェントを使うためのプラットフォーム上で、タスクの確認・割り当て、タスクに沿った参考資料、移動中に聞く音声作成、報告書の作成などをAIエージェントを活用することで効率化していた。
写真撮影で窓リフォームの提案スピードアップ!LIXIL x Gemini 開発秘話と効果
Liderより画像認識によるGeminiの方が上。
・ネイティブ開発不要
・iPhone最新機器不要
営業時に、従来の分厚いカタログを持ち込む必要がなくなった。
補助金の計算が緻密なため、AIで効率化。
生成 AI を活用したプロダクト開発のリアル:ノバセル & Ubie に学ぶ実践録
3つのプロジェクトを平行で動かして効率化(エージェントの結果待ち中に他のプロジェクトのエージェントを動かす)。
社内浸透のために、AIを使わない理由を問う面談や評価指標に利用率を盛り込むなどしている。
サードパーティーサービス(Cursor、Devinなど)よりLLM開発元のサービス(Claude Code、Gemini CLIなど)を使うほうが良いと推奨していたが、個人的には同意できない。LLMがブラックボックスに近く、開発元自体、原理が理解できていないため。
第 2 回 AI Agent Hackathon with Google Cloud 最終ピッチ & 表彰式
旅行のバイブプランニング
行先に基づいて、追加の行き先、口コミの分析、利用者趣向とのマッチングやルートの構築を対話を混ぜ込みながら自動で行う。
音楽教育
初めは、自由に何でもできるサンドボックス状態。AIによって必要な情報を必要なタイミングで提供し、学習を進める。
学校だよりAI
音声ベースでエージェントと会話を売ることで学校だよりを生成し、投稿まで行う。
Smart Twin Room
部屋の写真を撮ることで、間取りに応じた家具を選定してくれる。
https://zenn.dev/yumabo/articles/21cf9234d07328
KnockAI
建築業界における、図面を読み込むことでそこから見積を行う。
https://zenn.dev/enostech/articles/8a4a3f2589afd7
まとめ
LLM自体は、既知の情報通りで特に目新しいものはなかった。それらを、実務に落とし込む点での紹介がほとんど。
AIサービスにおいて、完ぺきな出力は保証できないため、補助的なものとして捉え、手動入力も配慮したUI/UXが事例デモを通して見受けられた。