AWS認定機械学習についてきちんと勉強したい方向けに書きました。
主に私が調べた予想出題範囲と機械学習のラーニングパスについてまとめています。
まとめたラーニングパスの使い方も載せていますので参考になれば幸いです。
※私自身が試験を受けるのは本記事を投稿した翌日になります。
(本来は受験後に検証結果として記事を書きたかったのですが都合が合いませんでした。合格していましたら以下で合格報告します)
合格してたか?「合格してました!記事で書いてることもまちがってないです!」
2023年時点でのAWS認定機械学習予想出題範囲
私が公式シラバス、Qiitaや個人ブログ、Udemy講座など様々な所から集めた情報をまとめました。
- 機械学習について(70%)
・機械学習アルゴリズムの特徴
・特徴量エンジニアリング
・モデルの最適化について - AWS SageMakerやAIサービスについて(20%)
- AWSソリューションアーキテクトアソシエイトレベルの知識(10%)
主に機械学習の知識を問われる試験です。
機械学習の知識をもとにSageMakerでの実装方法を問われます。
しかしこの2つは独立したカテゴリではなく関連しています。
ですので前者、もしくは後者のどちらか一方を理解していない状態での合格は難しいと思われます。
AWS公式の試験範囲を参照しても、機械学習について多く問われることが書かれています。
推奨される AWS の知識
受験対象者は、以下の AWS の知識を有している必要があります。
• 基本的な機械学習アルゴリズムの背後にある直感的知識を表現する能力
• 基本的なハイパーパラメータ最適化の実行に関する経験
• 機械学習および深層学習のフレームワークに関する経験
• モデルトレーニングのベストプラクティスに従う能力
• デプロイのベストプラクティスに従う機能
• 運用上のベストプラクティスに従う能力
というかシラバスに書いてある内容、全部重要ですので見ておきましょう。
https://d1.awsstatic.com/ja_JP/training-and-certification/docs-ml/AWS-Certified-Machine-Learning-Specialty_Exam-Guide.pdf
AWS認定機械学習のオススメ教材
AWS試験対策本シリーズには残念ながらまだ機械学習シリーズはありません。
しかし機械学習について真っ当に勉強を行えば合格を狙える試験だと考えられます。
以下の3冊とUdemyの講座を1つ、加えて公式のExam Redinessとサンプル問題をやるといいでしょう。
①深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版
https://amzn.to/3t35f9P
この本の4−6章をやることで、基本的な機械学習の知識を仕入れる事ができます。
②ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
https://amzn.to/487yuac
①の本だと国語的な理解にとどまると思います。
この本で具体的な実装の理解を得ましょう。
シグモイド関数とかソフトマックスとかその他色々について、つまりなんなのさ?というところは実装を通してでしか理解できないはずです。
AWS認定機械学習で問われる機械学習の知識を正確に得ることができます。
余裕があればゼロから作るDeep Learning ❷ ―自然言語処理編もオススメします。
自然言語処理に関する知識もテストでは出題が考えられるからです。
③AWS Certified Machine Learning Specialty 2023 - Hands On!
https://www.udemy.com/course/aws-machine-learning/
超有名なAWS講座です。
boxなどの有名企業もこの講座で勉強しており、
講座の作成者はAWS Hero(超少数のAWS界隈のすごい人)として認定されているので講座の質は抜群に良いです。
https://aws.amazon.com/jp/blogs/news/announcing-the-newest-aws-heroes-august-2020/
ソリューションアーキテクトアソシエイトの知識を持っているなら、
Modeling Part1-4とMachine Learning Implementation and Operationsの5パートを重点的に学習してください。
①ー②では試験対策として不足していた知識を追加できます。
事前に①ー②を読んでからの方が頭に入っていくはずですので③番目に紹介しました。
機械学習に関する基本的な知識があるならこの講座から初めて良いでしょう。
おまけとして高校数学をこの機会に学び直したい方には以下の書籍がオススメです。
https://amzn.to/46PI5l3
どの程度まで深掘りするか
目安として記載いたします。
・機械学習アルゴリズムの特徴
単に何に使うかくらいの理解だけでは不十分(似たようなアルゴリズムが多い)。
例えば分類でも顧客分類と画像分類では全然違う。
分類だけで覚えていると間違うはず。
構造化データを用いるか、非構造化データを用いるのか?
アルゴリズムの一般的なユースケースは何か?
これくらいは知っておきたい。
・特徴量エンジニアリング
L1, L2正規化など。
特徴量を操作してモデルのトレーニング精度を上げていく仕組みを知っておく。
・モデルの最適化について
トレーニング後の最適化について知っておくこと。
正解率、適合率、再現率、F値などを見て、どの尺度を用いてどう改善していくかがわかる。
過学習について原則的な対処ができる。
勾配降下法について知っていて対策ができる。
これ+Sage MakerとAIサービスに関する知識が求められますので、機械学習未経験者がきちんと学ぼうと思うと相当な勉強量が求められます。
私自身は一時期機械学習をやろうと思い少しだけ知識がありましたが、それでも1ヶ月近くインプットに使っています。
結果的に面白かったですが、高額な受験料もあり相当ストレスを抱えながら勉強しておりました。
一言まとめ
機械学習ちゃんと理解しないと受からん。
以上
ありがとうございました。