はじめに
2020年11月、AWS-Certified-Machine-Learning-Specialtyに合格しましたのでその記録を残しておきます。
機械学習系の業務経験としては、約一年間AI開発系の業務に携わっており、特にここ半年間はSagemakerを使ってモデルの開発をしたりしています。
また、学部生時代は人工知能について専攻しており、元々機械学習についてはそれなりの知識がありました。
しかし、今回改めて勉強する中で結構基礎的(適合率とか再現率とかごちゃごちゃになってた)なことも忘れていたので機械学習の経験があまりない方も参考になると思います。
試験概要
他の人も書かれていますが、AWS色が薄く、純粋な機械学習の知識が必要な問題が多かったです。
所感として4割くらいがAWSと全く関係ない機械学習関連の問題でしたね。
機械学習関連の問題としてはディープラーニングのハイパーパラメーターチューニング、混同行列、TF-IDF、ベイズ統計、その他さまざまな機械学習の手法とかなり広く聞かれた印象でした。
AWS関連の話題としてはS3、Kinesis、EMR、Glue等を使ったデータエンジニアリングから、Sagemakerの運用方法、Rekognition, Comprehend等のAWSのAI関連のサービスについて問われることが多かったです。
勉強方法
おススメの教材
-
AWS Certified Machine Learning Specialty 2020 - Hands On!
- 個人的にかなりおススメ
- 試験範囲の大半の部分をカバーできるし、特にAWSのサービスで押さえておくべき部分がかなり網羅されている
- 機械学習関連に関しても押さえておくべき手法やチューニング方法が解説されている(ただこれだけだと不足かも・・・)
- フルプライスだと高くつくがセールで9割引してる時があるのでその時を狙って買うのが良いかも
- 全て英語なので注意
-
ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
- 試験関係なく、ディープラーニングを学ぶ人には読んでおいてほしい本
- 難しい数式を使うことなくディープラーニングについて解説してあるので、初学者にもとっ付きやすい
- これを読破することで、試験にも頻繁に問われるディープラーニングのハイパーパラメータチューニングに対する一通りの知識が身につくはず
-
Coursera Machine Learning
- こちらも試験関係なく機械学習を学ぶ人には押さえておいてほしい教材
- Couseraでもトップクラスに人気のあるコースで無料で受講可能
- 様々な機械学習の手法を丁寧に解説されており、それぞれの手法のイメージをつかみやすい
- 全て英語だが、日本語での字幕あり(たまに訳が怪しいのでそこは気をつけた方がいい)
-
Black Belt
- やはりサービスの細かい仕様をつかむ際はこれ
実践
以下の記事を参考に実際にSagemakerを使ってモデル構築~学習~推論までの流れを自分で実装してみるとなお良いと思います。
- [チュートリアル] Amazon SageMakerでの学習・デプロイ
- Amazon SageMakerで独自アルゴリズムを使ったトレーニング(学習)の作り方
- AWS SageMakerでモデルのデプロイから推論(バッチ変換ジョブ)までを行う
押さえておきたいAWSのサービス
- Amazon S3
- Amazon Kinesis Data Streams
- Amazon Kinesis Data Analytics
- Amazon Kinesis Video Streams
- AWS Glue
- Amazon Athena
- Amazon Quicksight
- Amazon EMR
- Amazon ECR
- Amazon Comprehend
- Amazon Translate
- Amazon Transcribe
- Amazon Polly
- Amazon Rekognition
- Amazon Forecast
- Amazon Lex
- Amazon Sagemaker
まとめ
試験を通して改めて機械学習関連の勉強を行って、不明だった部分が明瞭になったり、AI関連のAWSのサービスに詳しくなったり良い経験になったと思います。