はじめに
AWS Summit Japan 2025に参加してきました!
印象に残ったセッションやExpo、業務に活用できそうな技術やアイデアについて簡単にまとめてます。この記事を読んで、少しでも役立てれば幸いです!
※今回参加の目的がBedrockを始めとした生成AI関連の知見を増やすことだったので、生成AI関連の記述多めです。
特に印象に残ったセッションまとめとメモ
※★の数がおすすめ順です。(★1から★3まで)
★ Amazon Bedrock によるコスト最適化とスケーラブルなエンタープライズワークロードの実現 (AWS-23)
- Amazon Bedrock Guardrailsを使って、ガバナンスプロセスを合理化できる
- Amazon Bedrockのコストタグ付けと管理を行うことで、アラート設定し、予算超過を防げる
- Amazon Bedrockリソースタグ付けを使えば、ユーザー定義のアプリケーション推論プロファイルでコスト管理と予算管理のために実行時のモデル呼び出しのタグ付けが可能(=モデル呼び出しごとに予算管理できる)
- Amazon CloudWatch では Amazon Bedrock の自動ダッシュボードが用意されており、「呼び出しパフォーマンス」、「RAG検索パフォーマンス」、「トークン利用料」、「機密データ検出」ができる(知らなかった)
★ Amazon Bedrock による生成 AI ワークロードの最適化と拡張- コスト、速度、精度の最適バランスを目指して - (AWS-53)
- Amazon Bedrock Intelligent Prompt Routingを使えば、プロンプトの内容に応じて適切なモデルへルーティングしてくれる
- 例えば、Anthropic社のClaude3.5 SonnetとClaude 3.0 Haikuの2つを選択し、応答差(品質閾値設定)がある時に適切にモデルを選択してくれる!(ただし英語対応のみ)
- Amazon BedrockのModel Distillation(モデル蒸留)を用いれば、大規模モデルの知識を小規模モデルに転移させ、推論のパフォーマンスアップにつながる
★★★ 生成 AI による検索アプリケーションの拡張 (AWS-54)
- セマンティック検索(意味のある検索)でユーザーの意図にあった情報を検索
- エンべディングは簡単にいうと、すべてのデータソースを平面に点をプロット(エンベット)し、この点を過去の学習から配置 + 質問を平面に点をプロット(エンベット)して、質問から一番近いドキュメントの意味から最もよさげなデータソースを提示
- チャンキングは長い文章を分割することで、これの分割がAIの回答精度向上に重要。短すぎても精度悪化、長すぎても情報の取りこぼし発生
- チャンキングにもエンべディング。セマンティックチャンキングがある
- OpenSearch Serverlessを使って、RAG用のknowledgebaseとしても使える
- S3、Knowledge Bases for Amazon Bedrockとの組み合わせがトレンドという印象(所感)
★★ AI アプリケーションのためのデータエンジニアリング戦略- Amazon Bedrock で実現する構造化データ活用 (AWS-46)
- NL2SQLで構造化データのためのRAGを構成できるよ(ただし、めっちゃ難しいけど)
- 難しい理由としては、データベースやテーブル、スキーマに合わせてパーソナライズする必要があること
- データの中身に合わせてパーソナライズする必要があること
- SQLクエリエンジンに合わせてパーソナライズする必要があることから
- プロンプトエンジニアリングやAIエージェントの活用などあるけど、手間やコストが莫大
- これの解決として、Amazon Bedrock knowledge Baseの構造化データ取得機能がある
- Amazon Bedrock knowledge Baseの構造化データ取得機能を使えば、NL2SQLによる構造化データのRAGを実現できる
- Amazon Bedrock Agentで中央集権的に管理すれば非構造化データと構造化データのどちらにも対応した適切なナレッジベースの呼び出しが可能
特に印象に残ったAWS Expoまとめとメモ
■ Amazon Bedrock (AWS Village)
- Amazon Bedrockによる問い合わせ対応エージェントのデモのアーキテクチャ図を解説してくれた
- 特に、Knowledge Bases for Amazon BedrockとOpenSearch Serverlessを使ったRAG構成チャットボットに興味があったので色々とコミュニケーションを取れた
■ 生成 AI アプリ & Hub GenU (One - AWS Zone)
- Generative AI Use Cases(略称︓GenU)を使えば、すぐに⽣成AIアプリ実装が可能
- このブース担当のAWS社員さんがとても親切で色々とチャットボット改善に関してのアドバイスを頂けた
■ Aws サーバーレスサービスで実現するラーメン山岡家のキッチンオペレーション効率化 (Industries Pavilion)
■ 生成 AI でホワイトボードからアーキテクチャ図を生成しセキュアにデプロイ! (Buildersʼ Fair)
- Diagram-as-codeというAws Japan開発のLibraryを使うと、テキストベースから自動でアーキテクチャ図を生成することができる
- Diagram-as-codeとAmazon Bedrockを組み合わせることで自然言語の要件出しから始めてアーキテクチャ図を提示してくれる
- アーキテクチャ図からCloudFormationテンプレートを作成することまで可能
- アーキテクチャ図を描くから書くに変わる画期的なツールがDiagram-as-codeである
参考になりそうな資料:
AWS 環境の可視化を加速する Diagram-as-code とAmazon Bedrockの活用
■ Serverlesspresso -コーヒーをサーバーレスとともに - (Buildersʼ Fair)
■ 最先端の AI 技術で、あなただけの F1 サーキットを創り出す (Formula 1 特別体験プログラム)
- Amazon Bedrockを使って、オリジナルコースのデザインできた
- AIがそれっぽいコース名やコースのカーブにな雨を付けたり、FIマシンを生成したりと凄かった
- 作成したコースでF1マシンのシミュレーションを体験できた
業務に活用できそうな技術やアイデアまとめ
既存のAmazon BedrockとAmazon Kendraを用いたRAGチャットからKnowledge Bases for Amazon BedrockとOpenSearch Serverlessを用いたRAGチャットへ切り替えたほうがいいなと思っています。
既存のチャットボットに関しては以下を参照:
【Amazon Bedrock × Streamlit】社内ガイドラインを利用したチャットボットアプリ開発
【Streamlit × Langchain】チャットボットアプリを開発してみよう
理由としては、Amazon Kendraでは精度を上げるのが難しいと感じていることと、OpenSearch Serverlessを使って、ベクトル化の設計をセルフでやれば精度を上げられそうだなと思ったからです。
また、精度向上にはチャンクのチューニングが重要とのことなので、そこに関しても深ぼっていきたいと思っています。Knowledge Bases for Amazon Bedrock のチャンキング戦略にはいくつか種類がありますが、その中でもおすすめは、情報を子チャンクと親チャンクの入れ子構造に整理する階層的チャンキングだそうです。詳しくは後程調べてみようと思います。
他にも、Amazon Bedrock Intelligent Prompt Routingを使って、質問内容に応じた適切なモデルルーティングやAmazon Bedrock knowledge Baseの構造化データ取得機能を使った、NL2SQLによる構造化データのRAG実装も取り入れられそうだなと考えています。
色々と楽しそうな情報をキャッチアップできたので考えがまとまったら、次回のQuita記事に執筆しようと思います!
AWS Summit Japan 2025のオンデマンド配信
日本最大の "AWS を学ぶイベント" AWS Summit Japan が 6 月 25 日(水)、26 日(木)の二日間で開催されました。現在 7 月 11 日までの期間限定でオンデマンド配信中です。
7 月 11 日までの期間限定でオンデマンド配信中とのことですので、参加できなかった皆様も動画視聴いただけるようです!