はじめに
AWS Certified AI Practitionerは、AI/MLや生成AIの基礎知識と、AWSのAI関連サービスの理解を問う認定試験です。
「AIの試験」と聞くと難しそうに感じるかもしれませんが、AIモデルを自分で実装する試験ではありません。
この記事では非エンジニアの方や、AIにまだ自信がない方でも読み進めやすいように、できるだけ用語をかみ砕いて整理していきます。
今回は第1回として、試験概要と、すぐにイメージしやすいAWSのAIサービスを中心に扱います。
※本記事はAI初心者の方が全体像をつかむことを目的としているため、厳密な定義よりも理解しやすさを優先して説明しています。正確な定義や詳細な仕様については、公式ドキュメントや専門書を確認してください。
なお、Amazon BedrockやAmazon SageMaker AIも重要なサービスですが、本記事では詳しく扱わず、別記事で改めて整理する予定です。
想定読者
- AI活用に興味がある非エンジニアの方(ビジネスアナリスト、プロダクトマネージャーなど)
- AWS Certified AI Practitionerに興味はあるが、少しハードルが高いと感じている方
- AI/MLやAWSの用語にまだ自信がない方
この記事のゴール
- AWS Certified AI Practitionerで問われる内容の全体像をつかむ
- 「自分でもAI Practitionerを受けられそう」と感じられる
- 参考書や問題集に取り組む前のハードルを下げる
AWS AI Practitionerはどんな試験か
試験の対象者
「AWSのAI試験」と聞くと、AIエンジニア向けの試験のように感じるかもしれません。
しかし、公式サイトを見ると、AWS Certified AI Practitionerは必ずしもAI/MLシステムを構築するエンジニアだけを対象にした試験ではありません。
公式サイトでは、対象受験者について以下のように説明されています。
AWS の AI/ML テクノロジーを使用するソリューションを熟知してはいるが、必ずしも構築するわけではないという個人
また、受験者の役割例として、ビジネスアナリスト、ITサポート、マーケティング担当者、プロダクトマネージャー、プロジェクトマネージャー、営業職なども挙げられています。
つまり、AIモデルを自分で実装できることよりも、AI/MLや生成AIの基本概念、AWSのAI関連サービスの使いどころを理解していることが重視される試験です。
まずは試験ガイドを読んでみよう
まず確認しておきたいのが、公式の試験ガイドです。
特に以下の2つは必ず確認しておくことをお勧めします。
- コンテンツ分野と重み
- 対象のAWSサービス
コンテンツ分野と重み
各コンテンツ分野にはタスクステートメントという試験で見られる要件と配点が書かれています。
この内容を1つずつ照らし合わせて、自身が要件を満たせているか確認することで、どこを重点的に勉強するべきかがわかります。
タスクステートメント 1.1: AI の基本的な概念と用語を説明する。
対象:
- 基本的な AI 用語 [AI、ML、深層学習、ニューラルネットワーク、コンピュータビジョン、自然言語処理 (NLP)、モデル、アルゴリズム、トレーニングと推論、バイアス、公平性、フィット、大規模言語モデル (LLM)、生成 AI (GenAI)、エージェンティック AI など] を定義する。
- AI、ML、GenAI、深層学習、エージェンティック AI の類似点と相違点を説明する。
- さまざまな種類の推論 (バッチ、リアルタイム、非同期、サーバーレスなど) について説明する。
- AI モデルに含まれるさまざまな種類のデータ (ラベル付きとラベルなし、表形式、時系列、画像、テキスト、構造化データと非構造化データなど) について説明する。
- さまざまな種類の AI/ML 学習 (教師あり学習、教師なし学習、強化学習の方法など) について説明する。
対象のAWS サービス
こちらも非常に重要です。試験範囲に含まれる主なAWSサービスが書かれています。
市販の参考書や問題集がすべてのサービスを網羅しているとは限らないため、参考書に載っていないサービスについては、公式ドキュメントで概要だけでも確認しておくと安心です。
とはいえ、すべてのサービスを深く理解する必要はありません。
まずは「何をするためのサービスなのか」をざっくり説明できるレベルを目指すとよいと思います。
実際にサービスを触ってみる
時間とお金に余裕があれば、実際にAWSアカウントを作成して、AWSサービスを触ってみることもおすすめです。
多くのAIサービスは、AWSアカウントがあればマネジメントコンソール上から試すことができます。アプリケーションを実装しなくても、「実際にどんなものなのか」を体験できます。
たとえば、Amazon Textractでサンプルの請求書画像を読み取ってみたり、Amazon Rekognitionで画像にどのようなラベルが付くのかを確認してみたりすると、サービスのイメージが掴みやすくなります。
ただし、AWSサービスでは利用内容によって料金が発生する場合があります。事前に料金ページを確認し、使い終わったリソースやデータは整理しておくと安心です。
AI/機械学習/深層学習/生成AIの関係
AWS AI Practitionerでは、AWSサービスの内容だけでなく、AI、機械学習、深層学習、生成AIといった用語の意味も問われます。
かなりざっくり言うと、AIが一番広い概念で、その中に機械学習があり、さらにその中に深層学習があります。生成AIは、深層学習や基盤モデルを活用した代表的な応用分野として理解するとよいと思います。
本記事では詳しく扱いませんが、まずは以下のような関係として押さえておくと十分です。
- 人工知能(AI): 人間の知的なふるまいをコンピュータで実現しようとする広い考え方
- 機械学習(マシンラーニング): データからパターンを学習して、予測や分類を行う技術。機械学習の中でも教師あり学習、教師なし学習、強化学習などがある
- 深層学習(ディープラーニング): ニューラルネットワークを使った機械学習の一種
- 生成AI: 文章、画像、音声などを新しく生成するAI
AI関連のAWSサービス
AI関連のAWSサービスには、主に3種類あります
- すぐ使える用途別AIサービス(文字起こし、翻訳、画像分析など)
- 自分たちで機械学習モデルを作るためのサービス(Amazon SageMaker AIなど)
- 基盤モデルを使って生成AIアプリケーションを作るためのサービス(Amazon Bedrockなど)
第1回の本記事では、「1.すぐ使える用途別AIサービス(文字起こし、翻訳、画像分析など)」についてまとめます
Amazon Textract
いわゆるOCRサービスです。PDFファイルや文書画像から文字を抽出してくれます。
また、単純な文字起こしだけでなく、表やフォームを自動で認識し、整理した上で出力してくれます。
ユースケースとしては、請求書のPDFから日付と氏名だけを抽出したり、明細画像を表形式のまま取得したりできます。
Amazon Rekognition
画像認識・動画認識系のサービスです。
画像と動画のどちらにも対応しているだけでなく、用途も多いので注意が必要です。
ここでは、Amazon Rekognitionでできることのうち、代表的なものだけを取り上げます。
(すべての機能を網羅するものではないので、詳細は公式ドキュメントを確認してください。)
物体検出・ラベル検出
画像や動画に写っている物体などを検出し、ラベルとして返します。
たとえば、画像に「車」「人」「道路」「建物」などが写っていることを判定できます。
ECサイトの商品画像の分類、写真管理アプリでの自動タグ付け、動画内のシーン分析などに使えます。
顔の検出・比較・検索
画像や動画に写っている顔を検出できます。
2つの画像に写っている顔を比較し、同一人物である可能性を類似度として返すこともできます。
あらかじめ登録した顔の特徴情報をもとに、似ている顔を検索することも可能です。
本人確認、ユーザー登録時の顔照合、入退室管理、動画内の人物検索などに使えます。
不適切コンテンツ検出
Amazon Rekognitionは、画像や動画に含まれる不適切なコンテンツを検出することもできます。
たとえば、ユーザー投稿画像や動画に対して、暴力的・性的なコンテンツが含まれていないかをチェックする用途です。
SNS、マッチングアプリなどのモデレーションで使われます。
すぐ使えるAIサービスを「入力 → 出力」で整理する
「1.すぐ使える用途別AIサービス(文字起こし、翻訳、画像分析など)」を表にまとめます。
「サービス名・入出力の形式・ユースケース」をセットで覚えると良いです
| サービス名 | 入出力の形式 | 概要 | 主な用途・イメージ |
|---|---|---|---|
| Amazon Transcribe | 音声 → テキスト | 音声データを文字起こしする | コールセンター音声の文字起こし、ビデオ会議の文字起こし、字幕作成 |
| Amazon Polly | テキスト → 音声 | テキストを自然な音声に変換する | VOICEVOXや読み上げソフトのように、テキストから音声を作るイメージ |
| Amazon Textract | 文書画像/PDF → テキスト・表・フォーム情報 | PDFファイルや画像から文字・表・フォーム情報を抽出するOCR系サービス | 請求書、申込書、帳票の読み取り |
| Amazon Translate | テキスト → 別言語のテキスト | テキストを機械翻訳する | 多言語対応、問い合わせ文の翻訳、リアルタイム翻訳 |
| Amazon Lex | テキスト/音声 → 対話 | チャットボットや音声ボットを作る | 問い合わせボット、予約受付、FAQ対話 |
| Amazon Rekognition | 画像/動画 → ラベル・人物・顔・テキスト等 | 画像や動画を分析する | 物体検出・ラベル検出、画像分類、顔分析、有名人認識、不適切画像検出 |
| Amazon Personalize | ユーザー行動/商品データ → レコメンド | ユーザーの行動や商品データをもとにレコメンドを作る | ECサイト、動画サイト、音楽サイトのおすすめ |
問題にチャレンジ
サンプル問題を2問作ってみました。
問1
あるSNS運営会社では、ユーザーが画像や動画をアップロードできます。運営会社は、アップロードされたコンテンツに不適切な内容やポリシー違反の可能性がある内容が含まれていないか確認する必要があります。
AWSサービスを利用して、画像・動画のモデレーションを効率的に行いたい場合、最も適したサービスはどれでしょうか。
A. Amazon SageMaker AI
B. Amazon Rekognition
C. Amazon Bedrock Guardrails
D. Amazon Translate
正解
正解は B. Amazon Rekognition です。
Amazon Rekognitionは、画像や動画を分析するサービスです。物体検出や顔分析だけでなく、不適切コンテンツの検出にも利用できます。
AのAmazon SageMaker AIは、機械学習モデルを構築・学習・デプロイするためのサービスです。
CのAmazon Bedrock Guardrailsは、生成AIアプリケーションの入出力を制御するための機能です。
DのAmazon Translateは、テキストを翻訳するためのサービスです。
問2
ある経理部門では、紙の請求書をスキャンした画像やPDFから、請求日、請求金額、取引先名などを自動で抽出したいと考えています。
AWSサービスを利用して、文書からテキストや表、フォーム情報を抽出したい場合、最も適したサービスはどれでしょうか。
A. Amazon Textract
B. Amazon Transcribe
C. Amazon Rekognition
D. Amazon Translate
正解
正解は A. Amazon Textract です。
Amazon Textractは、スキャンした文書画像やPDFから、テキスト、表、フォーム情報を抽出するサービスです。請求書、申込書、帳票などの読み取りに利用できます。
BのAmazon Transcribeは、音声をテキストに変換するサービスです。
CのAmazon Rekognitionは、画像や動画を分析するサービスです。
DのAmazon Translateは、テキストを別の言語に翻訳するサービスです。
まとめ
今回は、AWS Certified AI Practitionerの試験概要と、AWSが用意している代表的なAIサービスについて整理しました。
AI Practitionerでは、高度な理論や数学を扱えることよりも、用語の意味を理解し、それに対応するAWSサービスの使いどころを押さえることが重要です。
特に、Amazon Transcribe、Amazon Polly、Amazon Textract、Amazon Translate、Amazon Lex、Amazon Rekognition、Amazon Personalizeのようなサービスは、「何を入力すると、何が出力されるのか」で覚えると理解しやすくなります。
本記事が、「自分もAI Practitionerを受けてみようかな」と思うきっかけになれば幸いです。
