はじめに
この度AWS Certified AI Practitioner (AIF-C01)、AWS Certified Machine Learning
Engineer - Associate (MLA-C01) を受験しました。
双方なんとか合格できましたので、学習内容と受験した感想を書いておきます。
尚、本記事では、ベータ版を対象とした学習方法や受験した感想が中心となります。
対象読者
-
AI/MLサービスをAWSで実装するうえでの前提となる機械学習の知識やAWSサービスを知りたい
-
AIFやMLAをベータ版の期間中に取得したい (Early Adopterのバッジが欲しい!という方)
前提
-
AWS認定はAWS DEAまで13冠取得済み
-
AI/ML領域は自己学習と自社ハッカソンで触った程度。主にAmazon
Bedrock、Amazon Kendra、CodeWhisperer -
その他はGoogle セキュリティ プロフェッショナルとGoogle AI
エッセンシャル取得(履修?)済み
By 日本リスキリングコンソーシアム
https://japan-reskilling-consortium.jp/
※GoogleやMicrosoftをはじめとする、大手企業が作成したプログラムでクオリティ高く、無償も多いのでオススメです!
AWS Certified AI Practitioner(AIF)とAWS Certified Machine Learning Engineer - Associate(MLA)とは
概要
AWS Certified AI Practitioner (AIF-C01)
AWS Certified Machine Learning Engineer - Associate (MLA-C01)
共に、2024年8月からベータ版の提供が開始された、AI/ML関連の新しいAWS認定試験になります。これら2つのAWS試験は、基本的なAI/MLの知識をカバーし、最先端のAI/ML技術スタックと実際のユースケースを紹介し、受験者がスキルを習得するのに役立ちます。AI/MLエンジニアへのキャリアアップを検討している場合でも、AIの知識を深めようとしている場合でも、オススメです。
https://aws.amazon.com/jp/certification/certified-ai-practitioner/
https://aws.amazon.com/jp/certification/certified-machine-learning-engineer-associate/
試験期間(ベータ版)
AWS Certified AI Practitioner (以下 AIF-C01)、AWS Certified Machine Learning Engineer - Associate (以下 MLA-C01) 共にベータ版での提供になりますので、通常のプラクティショナー試験、アソシエイト試験とは試験時間や問題数に違いがあります。問題が通常より多い分、価格がリーズナブルという感じです。
対象受験者にある通り、AIF-C01は、AWSスキル保有が前提でないAIエンジニアやデータサイエンティスト向け、MLA-C01は、AWSスキル保有の前提でAI/ML設計構築を行うエンジニア向けの試験という理解です。
AI Practitioner(AIF) | Machine Learning Engineer - Associate(MLA) | |
---|---|---|
カテゴリ | Foundational | Associate |
試験時間 | 120分 ※AWS CLFは90分 | 170 分 ※AWS SAAは130分 |
試験の形態 | 85 問の問題 ※AWS CLFは65問 | 85 問の問題 ※AWS SAAは65問 |
コスト | 75 USD/10,000 JPY。 為替レートを含む他のコスト情報については、「試験の料金」をご覧ください | 75 USD/10,000 JPY。 為替レートを含む他のコスト情報については、「試験の料金」をご覧ください |
対象受験者 | AWS の AI/ML テクノロジーを使用するソリューションを熟知してはいるが、必ずしも構築するわけではないという個人 | Amazon SageMaker およびその他の ML エンジニアリング AWS サービスの使用経験が少なくとも 1 年ある個人 |
受験者の役割例 | ビジネスアナリスト、IT サポート、マーケティングプロフェッショナル、製品またはプロジェクトマネージャー、事業部門または IT マネージャー、セールスプロフェッショナル | バックエンドソフトウェア開発者、DevOps エンジニア、データエンジニア、MLOps エンジニア、データサイエンティスト |
受験オプション | Pearson VUE テストセンターまたはオンライン監督付き試験 | Pearson VUE テストセンターまたはオンライン監督付き試験 |
対象言語 | 英語、日本語 この試験の標準版は、2024 年後半に韓国語、ポルトガル語 (ブラジル)、簡体字中国語でもご利用いただけるようになる予定です。 | 英語、日本語 この試験の標準版は、2024 年後半に韓国語と簡体字中国語でもご利用いただけるようになる予定です。 |
学習内容
実際に私が行った学習内容です。AIF-C01は舐めてかかっていたこともあり、テストセンターで変な汗をダラダラかく羽目になりました。。ベータ版の内に受験したい方は、私のようにケチらずにAIF-C01もSkill Builder Advancedのサブスク購入をお勧めします。MLA-C01は、AIF-C01の反省を踏まえ、Skill Builder フルコースとAmazon SageMakerファミリーのBlack Belt視聴とドキュメント精読、サードパーティの過去問サイトでMLSを2周して臨みました。
AI Practitioner(AIF) | Machine Learning Engineer - Associate(MLA) |
---|---|
AWS Skill Builder 20問 Fundamental | AWS Skill Builder 20問 Fundamental |
AWS Skill Builder コース受講 Fundamental | AWS Skill Builder コース受講 Fundamental |
AWS Skill Builderコース受講 Advanced | |
AWS Skill Builder模試 65問 Advanced | |
Cloud License MLS 2周 |
学習のポイント 機械学習編
AIF-C01、MLA-C01共にAI/MLと関連AWSサービスのバランスの取れた知識を問われます。MLA-C01は特に機械学習関連の問題が多く出ます。ここでは、機械学習関連の解説を行います。
Amazon SageMaker 組み込みアルゴリズム
2つの試験でAmazon SageMaker 組み込みアルゴリズムは頻出します。AWS上で、AI/MLを実現するサービスと言えば、Amazon SageMakerがトップランナーだからです。一般的な機械学習用語とAmazon SageMaker 組み込みアルゴリズムが紐づきます。ここでは、あくまでAWS認定対策として記載します。
教師あり学習
線形学習とXGBoostは問題に取り上げられることが多い印象です。回帰から、不動産価格・売上・生産量等を予測するといったユースケースです。
アルゴリズム | 概要 | 分類: バイナリ | 分類: マルチクラス | 回帰 |
---|---|---|---|---|
線形学習 | 回帰用の線形関数または分類用の線形閾値関数を学習。 | はい | いいえ | はい |
XGBoost | 弱いモデルのアンサンブルで勾配ブースティングを実現。 | はい | はい | はい |
K近傍法 | 近傍のデータポイントを基に分類・回帰を行う。 | いいえ | はい | はい |
因数分解マシン | スパースデータの特徴間相互作用を効率的にモデル化。 | いいえ | いいえ | はい |
教師なし学習
主成分分析 (PCA)が高頻度で出題されます。過学習、L1/L2正則化、早期停止、ドロップアウト等の用語と絡めて覚えるとよいかと思います。他はランダムカットフォレスト(RCF)の異常検知やIPインサイトもちょこちょこと取り上げられる印象です。
アルゴリズム | 概要 | 用途 |
---|---|---|
K平均法 | データ内の個別のグループを見つけ、その後クラスター内のすべてのデータ ポイントが互いに類似しているかどうかを確認します。次に、別のクラスターのデータ ポイントが異なっているかどうかを確認します。 | クラスタリング |
潜在ディリクレ配分法 (LDA) | ドキュメント セット内のトピックを決定するのに適したアルゴリズムを決定します。 | クラスタリングとトピックモデリング |
Object2Vec | 特徴エンジニアリングに、高度にカスタマイズ可能な新しい多目的アルゴリズムを使用します。トレーニングにラベル付きデータを必要とするため、教師あり学習でもあるという、学習者を悩ますアルゴリズムです。 | 埋め込み |
ランダムカットフォレスト(RCF) | データセット内で、適切に構造化またはパターン化されたデータから逸脱した異常なデータ ポイントを検出します。 | 異常検出 |
IP Insights | IPv4 アドレスの使用パターンを学習する教師なしの学習アルゴリズムです。IPv4 アドレスと、ユーザー ID やアカウント番号などの各種エンティティとの間の関連付けをキャプチャするように設計されています。 | 異常検出 |
主成分分析(PCA) | データ ポイントを最初のいくつかの主成分に投影することで、データセット内の次元数、つまり特徴の数を減らします。その目的は、できるだけ多くの情報や変化を保持することです。 | 次元削減 |
テキストまたは音声データ
ニューラルトピックモデル (NTM) がよく取り上げられる印象です。Amazon SageMaker NTMは、統計的分布に基づいてトピックに分類する教師なし学習アルゴリズムで、頻出単語のパターンからトピックを推測し、ドキュメントの分類や要約、類似トピックの検索やコンテンツの推奨に利用されます。
アルゴリズム | 概要 | 用途 |
---|---|---|
BlazingText | Word2vec およびテキスト分類アルゴリズムのこの高度に最適化された実装は、大規模なデータセットに拡張できます。自然言語処理 (NLP) タスクに役立ちます。 | テキスト分類、Word2Vec |
Sequence to Sequence (seq2seq) | この教師ありアルゴリズムは、ニューラル機械翻訳によく使用されます。 | テキストまたは音声の機械翻訳 |
ニューラルトピックモデル (NTM) | 一連のドキュメント内のトピックを決定するためのもう 1 つの教師なし手法です。ニューラル ネットワーク アプローチを使用します。 | トピックモデリング |
画像や動画、時系列データ
画像分類やオブジェクト検出でResNetがよく取り上げられる印象です。他にはDeepARが時系列予測で取り上げられます。
アルゴリズム | 概要 | 用途 |
---|---|---|
ResNet | 画像分類の精度を高めるために開発されたディープラーニング ネットワークです。 | 画像分類 |
シングルショットマルチボックス検出器(SSD) | 事前トレーニング済の畳み込みニューラル ネットワーク (CNN) をベース ネットワークとして使用します。VGG-16 や ResNet-50 などのさまざまな CNN が利用可能です。 | 物体検出 |
セマンティックセグメンテーション | SageMakerセマンティックセグメンテーションは、画像のピクセルごとにクラスを割り当てる重要なアルゴリズムで、自動運転や医療画像診断に利用され、FCN、PSP、DeepLabV3が選択可能です。 | セマンティックセグメンテーション |
DeepAR予測アルゴリズム | この教師あり学習アルゴリズムは、再帰型ニューラルネットワーク (RNN) を使用してスカラー(1次元) 時系列を予測するためのものです。 | 時系列 |
強化学習 (RL)
強化学習と言えば、DeepRacerやルンバが有名です。強化学習(RL)は、サプライチェーン管理や自律走行車など複雑な問題を解決するのに適しています。エージェントはトライアンドエラーベースで行動して報酬や罰を受け、動的環境での意思決定を学習します。
名称 | 解説 |
---|---|
ディープラーニング (DL) フレームワーク | TensorFlow と Apache MXNet の RL をサポートしています。 |
RL ツールキット | RL ツールキットは、エージェントと環境間のインタラクションを管理し、最先端の RL アルゴリズムの幅広い選択肢を提供します。SageMaker は、Intel Coach および Ray RLlib ツールキットをサポートしています。 |
RL 環境 | カスタム環境、オープンソース環境、商用環境を使用できます。 |
混同行列
AIF-C01、MLA-C01共に混同行列は欠かせません。重要なので某有名キャラで分かりやすく表現してみました。
怒られたら、削除します。
名前 | 式 | 概要 |
---|---|---|
正解率 (accuracy) | (TP + TN) / (TP + FP + TN + FN) | 分類の正解率。全体のうちでどれだけが正しく分類できたか。 |
感度 (sensitivity) / 再現率 (Recall) | TP / (TP + FN) | 陽性のデータのうち、どれだけを陽性と分類できたか |
適合率 (precision) | TP / (TP + FP) | 陽性と判断されたデータのうち、どれだけが正しく分類できたか |
特異性 (specificity) | TN / (TN + FP) | 陰性のデータのうち、どれだけを陰性と分類できたか |
学習のポイント AWSサービス編
AIF-C01では、主にAmazon Bedrockと各機能及び、統合された各AWSサービス(Rekognition、Transcribe、Polly、Translate、Textract、Comprehend、Lex、Kendra)を抑える必要があります。生成AI系サービスが頻出し、Amazon SageMakerファミリーが少し出題される印象です。
MLA-C01では、Amazon SageMakerファミリーの理解とMLパイプラインのどのフェーズで使用されるか、把握する必要があります。
最低限覚えておいた方が良いAWSサービスと各試験での出題頻度を高頻度"〇"、中頻度"△"で表現しました。
サービス名 | 一言解説 | AIF-C01 | MLA-C01 |
---|---|---|---|
Amazon Bedrock | 基盤モデル利用AIサービス | 〇 | 〇 |
Amazon Rekognition | 画像解析 | 〇 | 〇 |
Amazon Polly | 読み上げ | 〇 | 〇 |
Amazon Transcribe | 文字起こし | 〇 | 〇 |
Amazon Comprehend | 感情分析 | 〇 | 〇 |
Amazon Translate | 翻訳 | 〇 | 〇 |
Amazon Textract | AI-OCR | 〇 | 〇 |
Amazon Kendra | インテリジェント検索 | 〇 | 〇 |
Amazon Lex | チャットボット | 〇 | 〇 |
Amazon Personalize | おすすめ | 〇 | 〇 |
Amazon SageMaker | モデル開発/学習/推論 | 〇 | 〇 |
Amazon SageMaker Canvas | ローコード/ノーコード機械学習サービス | △ | 〇 |
Amazon SageMaker Model Registry | 本番稼働用のモデルをカタログ化 | △ | 〇 |
Amazon SageMaker Clarify | バイアス/説明可能性/レポート | 〇 | 〇 |
Amazon SageMaker Jump Start | 事前構築済みMLソリューション | 〇 | 〇 |
Amazon SageMaker Data Wrangler | データ集約/準備 | △ | 〇 |
Amazon SageMaker Ground Truth | ラベリング | △ | 〇 |
Amazon SageMaker Autopilot | モデル自動構築 | △ | 〇 |
Amazon SageMaker Feature Store | 特徴量管理リポジトリ | △ | 〇 |
Amazon SageMaker Debugger | トレーニングジョブをデバッグ/分析 | △ | 〇 |
Amazon SageMaker Studio | 統合開発環境 | △ | 〇 |
Amazon SageMaker Pipelines | 機械学習向けCI/CDサービス | △ | 〇 |
Amazon SageMaker Model Monitor | モニタリング | △ | 〇 |
感想
AIF-C01の感想
『羊の皮を被った狼!』
「オレはMLSも保有してる。なんちゃらプラクティショナーなんて楽勝だぜ!」という認識で、正直舐めていました。。合格はしましたが、本当にギリギリでした。
オススメ学習法 対象:AIF-C01 ベータ版 (2024年10月現在)
-
Skill Builder
Advancedコースを受講する。各章の問題や模試を複数回受ける -
MLSの過去問を複数回解く
-
Amazon Bedrockと統合された関連サービス群(Rekognition、Polly、Transcribe、Comprehend、Translate、Textract、Kendra、Lex、Personalize等)のBlackbelt視聴やドキュメント精読する
MLA-C01の感想
『......まるでSageMakerのバーゲンセールだな......』
AIF-C01の苦い経験からMLA-C01は心を入れ替え、Skill Builderサブスクリプションを購入して、Advancedコース受講や模試を複数回受けました。
そのほかにCloud LicenseのMLSコースを2周程解いて、試験に臨みました。Amazon SageMaker関連の公式ドキュメント精読等も実施。Amazon SageMakerファミリーの把握が大変でした。結果として、AIFより良い点数で合格しました。
オススメ学習法 対象:MLA-C01 ベータ版 (2024年10月現在)
-
Skill Builder
Advancedコースを受講する。模試を複数回受ける -
MLSの過去問を複数回解く
-
Amazon SageMaker
関連のBlackbelt、各ドキュメントを読み込む
最後に
結果として、AIF-C01、MLA-C01共に合格することが出来ました。今までSkill Builderを活用してこなかったのですが、充実した内容にさすが本家と感心しました。全て英語のため、Chromeの翻訳や字幕機能に頼りっぱなしでしたが。2024年のノーベル賞受賞者もAI関連の受賞が多く、2024年がAI元年なのだなと改めて感じていました。
資格学習という形で、AI/MLというビッグウェーブに関わる機会を与えてくれたAWSに感謝です!
AI案件お待ちしております!