メモを書いてはいたんですが、投稿できてませんでした。メモ書きなので、間違っている所があれば教えてください。
Android関連が多めです。
太字にしているところは特に驚いたところでそこだけ見ていっても良いかもしれません。
Google I/O '26 Keynote
-
全体
- トークンがたくさん使われたという話
- 3.2 quadrillion tokens / month
- Model APIは19B tokens / minute
- 13 productsが1B users以上
- そのうち5つは3B users以上
- AI Searchがたくさん使われた
- AI Overviewsは2.5B monthly users
- AI Modeは1B monthly usersを超えた
- Gemini appは900M users
- Nano Bananaで50B images生成された
- トークンがたくさん使われたという話
-
Ask Maps
- 30分以内で◯◯ができる場所などを探せる

- https://youtu.be/wYSncx9zLIU?t=457
-
Ask YouTube
- 自転車の乗り方の教え方などを探せる
- 関連する動画の場所までジャンプできる
- フォローアップ質問もできる
-
Docs Live
- 声でドキュメント作れる
- DriveやGmailなど、色々Googleのサービスにアクセスしながら作れるっぽい
- Pro / Ultra向けに夏
-
TPU 8th generation
- TPU 8t / 8i
- 8tはtraining向け
- 前世代よりraw computing powerが約3倍
- 8iはinference向け
- 速い
- 1500 tokens / second近く出ていた
- 1M TPUs以上にまたがってtrainingできるらしい
- performance per wattも2倍
-
Model
- World model
- 世界を理解して、シミュレーションする
- Gemini Omni
- text / image / videoなど、any inputから作れる方向
- 正確なビデオが作れる
- conversational languageでvideo editingできる
- Gemini Omni FlashがI/Oの日に利用可能に
- Gemini Omni Proも今後
- SynthID
- 100B images and videosにwatermark
- 60,000 years of audio assetsにもwatermark
- Search / Chromeにも拡大
- OpenAI, Kakao, ElevenLabsも採用
- Gemini 3.5 Flash
- 他のfrontier modelsに比べて4倍速いらしい

- https://youtu.be/wYSncx9zLIU?t=1458
- codingやlong-horizon tasks向けにも改善
- AntigravityでI/Oの日に利用可能に
- APIsでもI/Oの日に利用可能
- Gemini 3.5 Pro
- 来月
- World model
-
Developer
- Antigravity
- Antigravity 2.0
- CLIもある
- SDKもある
- Android対応に

- https://youtu.be/wYSncx9zLIU?t=1599
- Firebase / Google AI Studioとも連携
- Subagents対応
- hooks / asynchronous task management対応
- Agent Harnessが強化
- Gemini 3.5 FlashはAntigravity内で12倍速いらしい
- 12時間でOSを作るデモ
- 93 subagents
- 15,000 model requests
- 2.6B tokens
- $1000未満
- Antigravity
-
Gemini Spark
- Google Cloud上のdedicated virtual machinesで動く
- AntigravityのHarnessが動く
- MCPなども動く
- 言葉でやりたいことを言ったら、タスク化して色々Googleのサービスを使ってやっておいてくれる
- 24/7で動く
- laptopを閉じても動く
- Gemini app / email / chatから使えるようになるっぽい
- 来週USでUltra向けbeta
- trusted testersには今週
- Gemini Workspace / Gemini Enterpriseにも来る
-
Google AI Ultra
- 新しいUltra planが$100から
- top tier Ultra planは$250から$200に
-
Android Halo
- 今年来る
- agentの進捗を画面上部で見せる AndroidのUI space
-
Search
-
AI ModeがGemini 3.5に
-
新しいSearch box
- 検索で補完が効くように
- text / images / files / videosで聞ける
-
AI OverviewsとAI Modeがつながる
-
Search agents
- スケジュールみたいな感じで探して教えてくれる?ようなAgentの機能
- 24/7で情報を見てくれる
- 夏リリース
-
Antigravity in Search
-
検索でAntigravityが動いてUIを作る
- コンセプトを試して理解できたり
- プランナーのWebページを作って見れたり、そしてそれをシェアできたり
- Generative UI
- 夏リリース
-
検索でAntigravityが動いてUIを作る
-
custom stateful experiences
- tools / trackers / dashboardsみたいなものを作れる
- まずはsubscribersから
-
-
Shopping
-
UCP
- Universal Commerce Protocol
- Agentとshoppingをつなぐ
- Amazon, Meta, Microsoft, Salesforce, Stripeがパートナーに加わった
-
AP2
- Agent Payments Protocol
- ユーザーが指定した価格などの基準が適用される
- Sparkでsoon
-
Universal Cart
- Search / Gemini / YouTube / Gmailなどをまたいでcartに入れられる
- price dropや在庫復活を見てくれる
- compatibilityも見てくれる
- USで夏
-
-
Gemini App
- Gemini 3.5 Flash
- Neural Expressiveというデザインに
- Android / iOS / Webで今日から
- Gemini Liveも変わる
- Gemini Omniが有料ユーザーでI/Oの日に利用可能に
- Daily Brief
- カレンダーやGmailなどを見て、今日の重要なことを整理して教えてくれる
- USで今日使えるように
- Gemini App Mac App
- pdfの情報をまとめてGmailにテーブルとして書いてくれたりする
- Function key長押しで声で操作できる
-
Google Pics
- Image creation and editing tool
- Google Workspaceの新しいproduct
- 画像を消しゴムみたいなやつで消したり、resizeしたり、text edit / translateしたりできる
- 今年夏
-
Stitch
- UI design tool
- 今日、リアルタイム編集できるように
- promptやvoiceでUIを変更できる
- code exportやlaunchもできる
-
Flow
-
Gemini Omni対応
-
agent対応
- 一枚の画像から16個のvideo angleを作るなど
- large-scale editsもできる
-
creative toolをvibe codingで作れる
-
Flow Musicもある
-
今日使えるらしい
-
-
Android
- Android XR
- Geminiと組み合わせたXR platform
- Display glasses
- 画面内に情報を出せる
- live translationなど
- Audio glasses
- 今年の秋に出る
- Geminiに聞いたり、音楽を聞いたり、写真を撮ったり、電話をかけたりできる
- 他の人と先週会った場所に案内してもらえるみたいなことができる
- グラスで「いつものカフェで注文できる?」って言ったら、勝手にDoorDashとかアプリ起動して注文できるデモ
- Audio glassで、ディスプレイをWatchを使って見ていた
- Android XR
-
Future of AI
- CodeMender API
- 脆弱性を直せるらしい
- CodeMender API
Developer Keynote (Google I/O '26)
- Model
- Interactions API
- 今はDeep Researchできる。
- Managed agentsの利用が可能に。
- リナックスの環境が作られる
- GitHubに繋げられる
- Stitchチームが実際にGitHubからデザインシステムを作成するような機能をこれで作った。
- リサーチ、スクリプト、スピーチ、音楽生成、画像生成を1APIで行う https://youtu.be/aqmpZocmR8o?t=315
- Interactions API
- AI Studio
- AI Studioで作ったプロジェクト Cloud Runを使ってクレカ無しでデプロイできるそう https://youtu.be/aqmpZocmR8o?t=615
- Antigravityとのインテグレーション。
- データベースやOAuthを使うようなアプリも作れる
- Google workspaceとの連携
-
AI StudioのAndroidサポート SDK入れなくても動く!
- AI Studio上でAndroid Emulatorが動く
- 自分の端末にも繋げばインストールできる(Web ADB。。かな?)
- Google Play Publishingもサポート
- AI Studioのモバイルアプリが登場(今日事前登録できる)
- Antigravity SDK
- 何でも走らせられるよ
-
AI StudioからAntigravityにExportできる機能を追加

- https://youtu.be/aqmpZocmR8o?t=872
- つまりAI StudioでVibeコードして、続きはAntigravityでやるみたいなのができるのかな?
- Antigravity 2.0
- Subagents
- QAなど
- Scheduled Tasks
- AntigravityでGemma4 Fine tune させるデモがあった (GPUが使えるサーバーでやる必要はあるみたい)
- Subagents
- Antigravity CLI
- 普通のAntigravityと同じハーネス。
- /btwなどが使える
- Antigravity
- AndroidやFirebase、Chromeのpluginが利用できる
- Science Skillsがリリース
- Gemini enterpriseを使っている方はこの数ヶ月でAntigravityが利用できるようになる。
- Android
- AntigravityでのAndroid開発のOfficial support
- https://youtu.be/aqmpZocmR8o?t=1606
- Skillを使うデモでWearへの対応を行う。ここでこのナビゲーションが気になったので投稿 (https://m3.material.io/components/toolbars/overview toolbarかもとのこと。 )

- https://x.com/new_runnable/status/2056990889982181413
-
Antigravity、
android studioコマンドを使ってライブラリバージョンを調べたりできる - AntigravityにBefore Afterのスクリーンショットを撮るようにお願いして、それを貼ってもらったりできる
-
Antigravity内で"Android StudioでCompose Preview見せて"で、Android Studio開いて見せてくれる。
- (ここでAndroid CLIにstudioコマンドが追加されてることに気づいた。便利そう https://x.com/new_runnable/status/2056996952546623564 )
- https://youtu.be/aqmpZocmR8o?t=1927

- Android SkillsのR8のConfiguration Analyzerを使うとOptimization Summaryでスコアなどが見られる
- Android StudioでDeepLinkうまく開けないときの解析のエージェント機能ができた
-
Android StudioからGoogle Playに直接アップロードできるようになった。
- Signed App Bundle or APKのダイアログの中にContinue to the Upload to Play Wizardでアップロードできる

- https://youtu.be/aqmpZocmR8o?t=2206
-
iOSのアプリ(React NativeでもWebフレームワークでも)のAndroidへの移行できるMigration Assistant
- https://youtu.be/aqmpZocmR8o?t=2256
- Journeysで確認させたりもできる
- 最初にFeature mappingを作っている
- pdfなどのVectorDrawableへの変換方法なども知っている。
- 移行アシスタントの移行アシスタントのKMPへの移行バージョンも計画中らしい
- Web
- どのAPIが使える、どうやって使うの問題
-
Baselineがそれを解決するそう。 - Modern Web Guidance: Webの機能についてAgentに教えるSkill。
-
- Web サイト側が WebMCP ツールを公開していれば、Gemini in Chrome でユーザーが指示したときに、その WebMCP ツールを使ってサイト内の操作を実行できるようになるみたい
- Chrome DevTools for agents
- 色々できるらしい

- https://youtu.be/aqmpZocmR8o?t=3188
- HTML in Canvas APIでCanvas内にHTMLを描画できる。(しかもDevToolでハイライトとかもできるし、翻訳とかもうごくそう)
- どのAPIが使える、どうやって使うの問題
What's new in Android
- Compose First
- android.widget.*はメンテナンスモードに。
- deprecateやremoveする予定は今はない。
- これはFragmentやRecyclerViewやMaterialのViewコンポーネントも同じ。
- クリティカルなバグ修正やクリティカルな機能のみ対応しJetpack Composeに集中
- Composeの移行のサポート
- 前にリリースしたSkillsにくわえてツールを用意している
- 詳細はAndroid Development Toolsで
- 前にリリースしたSkillsにくわえてツールを用意している
- Styles
- 1.11でexperimental
- Composeの挙動(behavior)と、見た目(appearance)を分離するもの
- カスタマイズが簡単に
- 押されている状態など、状態によって変えられたりするので、レスポンシブに出来たりする
- 専用セッションがある
- Build custom design systems with Jetpack Compose's new Style API
- Performance
- スクロールなどのパフォーマンス比較がみられる
- https://goo.gle/hero-benchmark
- R8インサイトをPlay Consoleに追加にしており、今日ロールアウト開始で、少しずつロールアウトしていく
- R8 configuration analyzer
- https://goo.gle/r8-analyzer
- どのぐらい効率的に最適化しているかスコアを付けてくれる。
- 改善余地を教えてくれる。例えばKeep Ruleが広すぎるなど
- Android 17でMemory limitsが導入された
- 以下のコードで、確認できるそう。

- https://youtu.be/8PxuWdjESfg?t=1103
- Android 17で、Profiling triggerとして、コールドスタートとCPUの使いすぎが使えるようになった。
- Leak canary profilerでメモリリークの追跡が早くなったのと、Geminiに説明させることができるそう
- Engineering memory-performant Android appsというセッションで説明があるそう。
- Android 17は通知につける画像のサイズに制限をかけたそう。
- Static finalがreflectionで変更できなくなった話
- messageQueueが早くなった話
- WebGPU
- Kotlinから使えるAPIがある。
- Adobe PremiereでJetpack Media3 Transformerと一緒に実際に使われる
- Android Performance Analyzer
- GPU, CPU, memoryなどいろんなプロファイルができる
- GPUのツールでロードと表示で26倍早くなったそう
- Operation systemから Intelligent system に
- 新しいAIを使った体験を届けるために全ての技術スタックを変える
- 例えばAutofillが賢くなったり
- メッセージングアプリでの詐欺メッセージの検知
- Magic cue (キーボードの下にでるやつ) アプリのコンテンツやアクションを提示できる(去年導入)
- Task Automation
- Geminiがアプリを解析し、タスクを行って、購入のときなどだけユーザーに聞いたりする。
- また別のバーチャルな画面ができるのでユーザーは見ていなくて良い
- アプリ側で何かをする必要はない
- Geminiがアプリを解析し、タスクを行って、購入のときなどだけユーザーに聞いたりする。
- App Functions
- Task Automationがあるが、アプリ側からできることを提供することもできる
- Android Platform API
- MCP実装を簡単にしてくれ、これをするとAndroid内のMCPサーバーのように動く。
- App FunctionとGemini統合はまだprivate preview。
- ただ、準備を始めることができる。
- KDocを使う
- デモ
- Now in Androidから情報を取ってそれをChatアプリで流すのを行った
- https://youtu.be/8PxuWdjESfg?t=1770

- https://goo.gle/eap-af でearly access program
- AppFunctions Jetpack Libraryで試せる
- Gemini Nano
- 140Mデバイスで動くそう
- Gemini Nano4
- 実際にwebexでは翻訳に使ったりなどで使ったそう。
- Photoshopでは自動でレイヤーのリネームをする機能など
- Deploy Android on-deviceというセッションで紹介されるそう
- A2UI Compose Renderer
- Build intelligent Android apps using Google's AIで紹介されるそう
- Accessibility
-
Pinch to zoom
- 拡大できるように
- Modifier.transformable で可能
-
TalkbackがAIで画像の詳細(content description)を自動作成できるように
- ただ、引き続き提供することを推奨するそうだが、ユーザー提供コンテンツなど、提供できないときに便利になる。

- https://youtu.be/8PxuWdjESfg?t=1954
-
新しいAccessibility Scanner
- ただ使え。だそう。
-
- セキュリティ
- Android 17でnative libraryがread onlyであることなどやOTPを含むSMSが3時間遅延することなど、準備するようにとのこと
- その代わりCredentialManagerでEmailや番号の認証ができるように
- またCredentialManagerは自動的にパスキーをパスワードユーザーに作るように。
- Health Connectでアプリからユーザーにsyncするように依頼する事ができる機能が追加されて接続フローが楽になったそう
- Companion devicesでのパーミッションリクエストが楽になったそう
- Android 17をターゲットにするアプリはローカルのデバイスを見つけたり、接続するのに、ローカルネットワークアクセスの権限が必要に。ただ全体にアクセスする必要無しで、特定のデバイスのみ許可することが可能になっているそう。
- Eye dropper
- ピクセルの情報だけを取るAPI (スクショの権限がいらない)
- Contact Picker
- 電話帳の必要な人の必要なフィールドのみ取得などをユーザーに選択させてできる
- Photo picker
- Live Update通知にいくつかのスタイルが追加
- Metric style
- Semantic color APIでステートを伝えることができるように
- Unified call history
- いろんなアプリの通話履歴をOSの電話帳で見られるようになるそう
- Emoji Update
- フラットで良い感じに
- Picture In PictureのJetpack Libraryの対応で、CameraXといっしょに使うと、原稿を読みながらSNS動画撮影が出来たりする。
- AIによるimage and video enhancementライブラリ
- ハイエンドデバイスで動く
- 画像や動画のアップスケールなどができるそう
- https://youtu.be/8PxuWdjESfg?t=2216

- ドキュメントはここにありそう https://developer.android.com/media/ai-enhancement/overview
- Android 17ではbackground audioに制限が入る。
- 旧な音が出ることでユーザーが恥ずかしい思いをするため。
- アラームは対象外。
- https://youtu.be/8PxuWdjESfg?t=2332
- https://developer.android.com/media/ai-enhancement/overview
- Android 17でMediaの対応フォーマットがいくつか増えたのと、カメラの改善が入った
- HDR Eclipsa Video
- 予期しない光の強さやレンダリングを防ぐ。
- 「Supercharge Android media experiences with Jetpack Media3 and CameraX」で紹介があるそう
- Adaptive
- ユーザー
- 580Mの大画面ユーザーが居る
- 大画面ユーザーは9倍使うし、Foldableユーザーは14倍アプリを使う
- Android 17
- 画面の向きなどによらずフルスクリーンで使われたりするため、Android 17ではこれらの属性が無効に。またオプトアウトが無効に。
- https://youtu.be/8PxuWdjESfg?t=2435

- ユーザー
- 待望のNavigation3のDeeplink対応、 1.2-alpha03(I/Oの日リリース)でリリースされている
- MediaQuery
- device capabilities
- FlexBoxとGrid
- 最近でで、柔軟なレイアウトができる
- TVのpointer input
- 早くポインターで移動できるように。ライブラリアプデしましょう。
- continue-on
- Android17 スマホで始めたタスクをデスクトップで対応続けられるようなもの
- https://goo.gle/continue-on
- Bubbles
- Android 11からあるやつ?
- 今はChatアプリ以外も使うようになって、大きい画面の端末ではバブルバーができてバブルを管理できる
- Android 11からあるやつ?
- Widget
- あるアプリでは、ウィジェットを使うユーザーは25%リテンション率が高いそう。
- Widgetはスマホだけじゃなくてフォルダブルやタブレット、Carなどでも使われる。
- Jetpack Glanceを使うとWear Widgetにもなる
- Snap scrollみたいなアニメーションが利用できる
- 内部的にはRemote Composeが使われる。
- アダプティブ系のセッション達
- Wear
- 10%バッテリー改善
- 動画再生などをしているときにWearにコントロールが表示されるように
- Live Update通知を使っている場合はWearにも出る。
- Automationの状態をWearで確認できる
- AppFunctionsで運動を始めたというのを受け取るなどWear OSのアプリでもできるそう
- OSの更新: Widgetを見るように。 Workout Tracker。
- Composeの更新 Ambient modeのハンドリングなど
- Android XR
- もうAdaptiveにアプリを作っているなら、すでにXR向けにも作られている
- Glassでは、Audio glassesとvisual glassがあり、visualとaudioオーバーレイで体験を高められる。
- Android XR SDK Developer Preview 4が出ている
- 3つライブラリがあるみたい

- https://youtu.be/8PxuWdjESfg?t=2798
- Scene Core
- immersive worldを作れるそう
- 手で、道路作ったらそこを車が走る。。

- https://youtu.be/8PxuWdjESfg?t=2810
- アプリのサイズを小さく保ちながら、作れるそう。
- ARCore for Jetpack XR
- geospatial APIによるナビを搭載したので、もう道迷わないよ(for Wired XR glasses)。だそう
- GODOTとUnreal Engineのサポート
- Jetpack Compose Glimmer
- Composeを使ってdisplay glasses向けのvisualと操作の制限をデザインできる。
- Skillで実装簡単にできる

- 2セッションあるそう https://youtu.be/8PxuWdjESfg?t=2860
- XR Catalyst Program
- https://g.co/dev/catalyst
- 検証できるXRのハードウェアにアクセスできるそう
- Cars
- Android Autoとcars with Google Built-in が別のシステム らしく、両方に作れるようにしているそう
- https://youtu.be/8PxuWdjESfg?t=2887
- CAL(Car App Library)を使うことで両方に作れるらしい
- Media Appのテンプレがある
- Google Maps SDKも使える
- 1.9で10個のコンポーネントとレイアウトを出すそう。
- parked と drivingを切り替えるAPIがlater this yearで来るそう(止まってるときは動画が見られるなど)
- Googlebook
- desktop対応していこうという話

- https://youtu.be/8PxuWdjESfg?t=2997
What's new in Android development tools
Android Bench, Android Knowledge baseの話など、割と知っている事が多かったので、そこは飛ばします。(なのでそれを知らない方は動画を見たほうが良いかと。)
- Agent Mode
-
Gemini EnterpriseでAndroid StudioのGeminiが使えるようになるという話。
-
AI Proとかのアカウントで使えるという話
-
Gemma4
- Android Optimized。Android APIsとKotlinで学習されている (とはいえ、Android Benchの結果的には、すごい強いというわけではないようにみえる)

- https://youtu.be/N4GgGBKnHe4?list=PLWz5rJ2EKKc-vRD1wCyEuPlkpLJhXhxJd&t=355
- Gemma4もAndroid Studioで指定できる
-
Compose Previewで右クリックでおかしいところを指定して、修正ができる
-
app link assistant。linkのおかしいところなどを調べてくれる(what's new in Androidでもみた)
-
- Android Studio Panda
- Android Automotive向けのテンプレがAndroid Studioにできた
- Android AutoとAndroid Automotive向けのアプリ作成が最適化される
- Gemini API Starter template
- FirebaseでGeminiを使うサンプル
- New Projects with AI
- プロジェクト作成をAIにやってもらえる
- Android Skills
- 今のモデルではうまくいかないタスクをカバーするものを提供している
- 最新のAdaptive APIやXML to Composeなど
- 今のモデルではうまくいかないタスクをカバーするものを提供している

- https://youtu.be/N4GgGBKnHe4?t=606
- Android Automotive向けのテンプレがAndroid Studioにできた
- Android Studio Quail
- デモで話す
- Android CLI
- Android agent first
- 他のLLMもAndroid Studioに繋げられる。
- SkillとKnowlege Base
- Updatable
- 3倍早くプロジェクトのセットアップができる
- Google Antigravity
- Android CLIとAndroid Skillsをバンドルするようになった
- デモ
- Android CLIの紹介
- android info -> どこにSDKインストールされてるか見られる
- android sdk
- sdkのリストなど
- android emulator startなど
- AI Studio -> Antigravityへの連携機能について
- AI Studioで作って、Antigravityに引き継いで作業させられる。
- Android Studio Quail
- Android Studio Agent ModeがAntigravity SDKに載せ替え中らしい
- https://youtu.be/N4GgGBKnHe4?t=1019
- Toggle show mapped tool callsで、AIが使ったツールが見られる。
- Agent Modeでsed, awk, perl, cat, lsをnative callに変換して、より良い統合にしている。これによりASが持つLintが使える(多分AS側のツールを使うように変換するって話だと思うんだけど、そんなことできるのか。。)
- コードレビュー機能
- マイグレーションアシスタント
- コメントやコードの構造を維持し、sync状態を維持できるように作っている
- マイグレーションツールではなくマイグレーションエージェントになっていて、マイグレーションをフラグで行うかとかを聞いてくれる。段階的移行などもできるようにしてくれる。
- Profiler
- "Why is my app startup so slow?"って聞ける

- https://youtube.com/watch?t=1802&v=N4GgGBKnHe4&feature=youtu.be
- スクリーンショットがProfiler内で見られるように
- Frame profilerもすぐにリリースされるそう
- LeakCanaryを有効にしてアプリを起動できて、内容を見られる
- R8 Configuration analyzer
- ライブラリの中にめちゃ広いKeep Ruleを持ってしまっているライブラリがあり、それでアプリのサイズが大きくなってしまう場合がある。
- 広いKeep Ruleの一覧がソートして見られて、クリックすると実際にKeepされているクラスの一覧が見られる。またどのライブラリがこれのKeepRuleを追加したかも分かる

- https://youtu.be/N4GgGBKnHe4?t=2012
- Lightbuild
- Android CLIの紹介
- Update
- Android Studio Quail
- Android Developer Verificatio Support
- AppBundleをリリースする前にアプリのパッケージ名が登録されているか確認できる。
- Android StudioのWireless Debugging 2.0
- **networkを変えても、PCを再起動してもつながる!**そう
- R8 Skillがバンドルされている。ので、R8でオプティマイズしてくれってお願いするだけ。
- ComposeのShared Element Transition debugging toolがリリース
- LookaheadAnimationVisualDebuggingWrapperで見られる
- Android Developer Verificatio Support
- Android Studio Quail
- まとめ
Build intelligent Android apps with Google's AI
- AI on Android
- 3つある
- アプリからシステムにできることを公開する
- アプリ内でのAI利用
- アプリ開発でのAI利用
- このセッションは2つ目 アプリ内でのAI利用 (In app intelligence)
- Jetpackerというサンプル旅行アプリがお題で7つのAI機能を実装していく
- 最初は旅行のサマリを作る機能
- ondeviceで行う
- costかからないし、オフラインで動く
- 旅行中なのでオフラインはありがたい
- costかからないし、オフラインで動く
- Gemini Nano 4を使う
- ML Kit GenAI Prompt APIを使う
-
AI Core previewに参加するとAI Coreのアプリが見えるようになる。
- (Google PlayでAI Coreアプリを開けて、そこでダイアログが出るのでOKしたら出てきました)
- Android StudioでもGemma4が試せる
- ondeviceで行う
- レシートから掛かったお金を計算する
- Nano 4はマルチモーダルのために作られて、画像理解に強い。
- ので、画像を渡して、jsonで返してもらうことができる。
- ML Kit Prompt API Structured OutputがComing soon
- https://youtu.be/_iuXykdlTkk?t=767 より


- こんな感じ
- on deviceについては "Deploy Android on-device" で
- ミュージアムアシスタント
- 次に行くところを決められる。
- Firebase AI Logicを使う
- startChat()を使うとChat履歴を管理してくれる
- コンテキストにテキストを渡したりする。
- URL Groundingで特定のURLを読み込むことができるAIとチャットできる
- 複数のURLを渡せる。 (FAQ的なチャットに便利そう)
- Google Maps groundingで、Google Mapに基づいて回答できる
- 子供向けメニューがある。ある施設の近くのレストラン。など
- Server Prompt Templatesで、プロンプトをサーバーで持って、変更できる
- App Checkでリクエストが本当のアプリから来ているか確認する
- レストランレビュー機能
- いくつかの質問に答えたらレビューのドラフトを書いてくれる
- Firebase AI Logic Hybrid inferenceを使う
- https://developer.android.com/ai/hybrid
- 4つオプションを選べる

- ホテルスタッフとのチャット機能での自動翻訳
- 翻訳したい場合
- ローカルで Nano v3で18言語、 Nano 4で35言語
- クラウドのTranslateGemmaで140言語対応している
- この場合Google Cloudにホストする
- ML Kit Language Identification APIで言語を知ることができる
- ホテルの予約
- Firebase AI Logicのマネージドバックエンドを使う
- サーバーでADKを使う
- アプリを閉じてもサーバー側でAIが完了させたりできる
-
AG-UI Protocolを使うことでサーバーのAgentと通信できる
- 調べたところによると
- イベント通信プロトコル
- SSEでもWebSocketでも動く
- UI部品そのものは定義しない
- やるべきことはコネクションをAG-UIで繋いで、イベントに対してどう表示するかを決める
- 調べたところによると
- ただAG-UIで実装したときに、UIの表示でバージョンごとに違ったりして、結構大変
- ここでComing soonなA2UI Compose Renderer

-
https://youtu.be/_iuXykdlTkk?t=2351
- ベーシックなテキストとかも送れるし、カスタムコンポーネントも使える
- コンポーネントとデータは分けて送られる
- AG-UIとA2UI
- 旅の途中に助けを借りる
- クラウドモデルでオーケストラレータは動くが、オンデバイスのサブエージェントにパスポートなどの個人情報関連の確認をさせる
- https://youtu.be/_iuXykdlTkk?t=2589

- https://youtu.be/_iuXykdlTkk?t=2587
- デモでは間違えたパスポート番号だったこととかなどが分かったりした。
- ADK for Androidでできる
- 3つある
まとめ
Agentを活用したり強化するというのが多かった印象があります。例えばAntigravityのハーネスがGoogleの各サービスに入っていく。などです。開発の文脈ではそのエージェントに道具や知識を与えるというところが多かった印象があります。



























