いつも記事を読んでいただきありがとうございます!
モブエンジニア(@mob-engineer)です!
昨日のAWSコミュニティHEROと学ぶ!Amazon Bedrock勉強会&事例共有会で紹介されていた、データオートメーション機能に関して気になったので少し遊んでみました。
遊んでみた系の記事ですので、お気軽に読んでいただければ幸いです。
補足
AWSコミュニティHEROと学ぶ!Amazon Bedrock勉強会&事例共有に関してはイベントレポート記事も執筆しております。
また、みのるんさん登壇資料も公開されています。
目次
- Amazon Bedrockデータオートメーション機能とは
- 遊んでみた
- デモ画面
- カスタム出力設定
- プロジェクト
- 所感
Amazon Bedrockデータオートメーション機能とは
2024.12.04に公開された公式ブログを見ると以下の通り説明がされていました。
Amazon Bedrock Data Automation は、ドキュメント、画像、ビデオ、オーディオファイルなどのマルチモーダルな非構造化コンテンツから貴重な洞察を抽出するプロセスを簡素化する Amazon Bedrock の機能です
引用元:新しいAmazon Bedrock機能により、データの処理と取得が強化されます
凄くざっくり言うと、画像データや証明書などをテキスト化させる機能のようですね。
現在はプレビュー期間なので、オレゴンリージョンでしか利用できないようです。
ちなみに、コンソールを見ると丁寧にユースケースが示されていました。
一般利用向け
保険会社などの特定業界向け
メディア会社(映像系)向け
遊んでみた
とりあえずプレビュー期間なので触ってみたいと思います。
デモ画面
デモ画面で利用できるものとして以下があるようです。
- ドキュメント(免許証など)
- イメージ(写真など)
- Video(動画など)
- Audio(音楽など)
とりあえず、各サンプルで試してみたいと思います。
ドキュメント(免許証)
データベース形式で出力されるようですね
イメージ(AWS広告画像)
画像に関する説明がテキストで出力されるようですね
動画(Making The Cut)
動画に関する概要説明とチャプターごとの説明がされているようですね。
(情報量がおおいのか、アップロード処理に時間がかかっているようでしたね)
音楽(AudioBook)
音楽に関する説明が出てきたよ感じですね。
カスタム出力設定
免許証、証券証書などの様々な書式様式に合わせて出力できるカタログをまとめているようでした。ユーザも作成できるので、会社独自の様式に合わせて作ることも可能だと思いました。
プロジェクト
ざっくり言えば、データオートメーション機能を要件ごとにまとめられる機能のように見えました。各書式に応じて、どのような出力をさせるかチューニングが行えるかと思います。
所感
画像、音声、動画などの非構造データをテキストデータに変換できるのはうれしい機能だと思いました。そのうえで、毒性検出や出力のカスタマイズも行えるので、求めているデータを良い感じで処理させるには使いやすい機能だと思いました。
そのうえで、データオートメーション機能があるからと言って、書式の様式変更時のチューニング作業が不要になるわけではないので、利用する前に取り込むデータの書式が変わる可能性があるかどうかの検討は必用なのかなぁと思いました。
また、出力精度に関する評価指標の項目がなかったので、本当に正しく出力されたのかよく分からないといった難点はあるのかなぁと個人的に思いました。
Amazon Bedrockは今後も触っていきたいサービスですので、引き続きキャッチアップを行っていきたいと思います。
最後まで、記事を読んでいただきありがとうございました。
参考ブログ