はじめに
MLA(AWS Certified Machine Learning Engineer - Associate)の学習を進めていると、
AWSにはさまざまなAI関連サービスが登場します。
ただ、サービスごとの役割や違いが把握しづらかったため、
各AI関連サービスを「一言」で整理しました!
また、機能が多いサービスや試験的に重要そうなものについては、
補足として「具体的に何ができるのか」も簡単に紹介しています。
なお、MLA対策としては以下の記事も公開しています。
SageMaker周りを中心にまとめているので、あわせて読むと理解が深まると思います!
AWSのAI関連サービスを一言で理解する
-
Amazon Bedrock
👉 生成AI(基盤モデル)をAPIで安全に使えるマネージドサービス -
Amazon Comprehend
👉 テキストの感情・言語・キーフレーズなどを解析する自然言語処理サービス -
Amazon Kendra
👉 社内文書などを対象にした高精度な検索エンジン(エンタープライズ検索) -
Amazon Lex
👉 チャットボットや音声ボットを作成する対話型AIサービス -
Amazon Polly
👉 テキストを自然な音声に変換する音声合成サービス -
Amazon Rekognition
👉 画像・動画から人や物、文字などを検出・分析する画像認識サービス -
Amazon SageMaker
👉 機械学習モデルの開発・学習・デプロイ・運用をまとめて行うプラットフォーム -
Amazon Textract
👉 PDFや画像から文字や表データを自動抽出するOCRサービス -
Amazon Transcribe
👉 音声データをテキストに変換する音声認識サービス -
Amazon Translate
👉 テキストを自動で多言語翻訳する機械翻訳サービス
補足
ここからは、特に重要 or できることが多いサービスについて補足します。
MLA対策としても理解を深めるのにおすすめです!
Amazon Bedrockのナレッジベース(Knowledge Bases)
Amazon Bedrockのナレッジベースは、
独自ドキュメントを検索対象として、生成AIが根拠を持って回答できるようにする仕組み。
大規模言語モデル(LLM)単体では学習していない
社内資料や独自データをもとに回答させたい場合に利用する。
内部的には
「検索(Retrieve)」+「生成(Generate)」 を組み合わせた
RAG(Retrieval-Augmented Generation)構成になっている。
利用方法
ナレッジベースは、以下の手順で利用できる。
-
データを用意する
PDFやテキストなどのドキュメントをS3に保存する -
ナレッジベースを作成する
Bedrock上でデータソース(S3)と基盤モデルを指定する -
質問を投げる
APIやコンソールから質問を送信する -
検索+生成による回答を取得する
関連ドキュメントを検索し、その内容をもとに回答が生成される
Amazon Comprehendでできること
Amazon Comprehendは、
テキストデータを自動で分析し、意味や特徴を抽出する自然言語処理サービス。
主に以下のことができる。
-
感情分析
ポジティブ・ネガティブ・ニュートラルなどの感情を判定できる -
キーフレーズ抽出
文書の重要な単語やフレーズを抽出できる -
エンティティ抽出
人名・組織名・場所・日付などを識別できる -
PII(個人情報)の検出
個人情報を含むテキストを識別・マスキングできる
おわりに
今回は、MLAでよく登場するAWSのAI関連サービスをまとめました。
サービス数が多い分、違いが分かりにくくなりがちですが、
一言で整理しておくと全体像を把握しやすくなります。
MLAの学習中や、AWSでAI機能を使った構成を考える際の
整理用として役立ててもらえたら嬉しいです!