はじめに
データアナリティクス専門知識(DAS)については、ビッグデータ専門知識試験(BDS)の後継認定区分として、2020年4月に開始されました。
今回、ビッグデータ専門知識取得の際に得た知識や、今般のAWSのサーバレスやマネージドを重視するETL関連の振り返りをかねて取得できた試験準備のコツなどについてまとめてみました。データアナリティクス専門知識に関わるAWS関連サービスのイメージを掴んでいただければ幸いです。
本記事の主な対象者
- AWS認定の他の試験区分は取得済みで、データアナリティクス専門知識の受験を検討している方
- 取得に向けて有効な学習方法などの情報収集したい方
筆者のAWS認定履歴
|AWS認定 |取得日 |
|---|---|---|
|ソリューションアーキテクト - アソシエイト |2018-05-13|
|デベロッパー - アソシエイト |2018-06-03|
|SysOpsアドミニストレーター - アソシエイト | 2018-06-10|
|ソリューションアーキテクト - プロフェッショナル |2018-07-29|
|DevOpsエンジニア - プロフェッショナル |2018-08-26|
|ビッグデータ専門知識 |2019-08-25|
|セキュリティ専門知識 |2019-12-08|
|機械学習専門知識 |2020-02-23|
|高度なネットワーキング専門知識 |2020-06-20|
|データベース専門知識 |2020-07-04|
|Alexaスキルビルダー専門知識 |2020-07-24|
|クラウドプラクティショナー |2020-07-27|
|データアナリティクス専門知識 |2020-11-21|
今回のスコア(2020-07-27受験)
総合スコア: 901/1000 (ボーダー750)
AWS 認定データアナリティクス専門知識(DAS)について
ここからが本題となります。
まずは、以下の公式ページから試験概要の把握を行いました。
具体的な試験準備で効果があったと思えること
-
AWS認定ビックデータ専門知識の試験範囲の振り返り
データアナリティクス専門知識については、ビックデータ専門知識の後継区分であると公式に発表されています。試験ガイド確認した限りでも、配点割合こそ変更はあるものの、試験分野としての「収集」「格納」「処理」「分析」「可視化」「セキュリティ」については同等でした。
上記より、ビックデータ専門知識を取得を取得した際に学習した内容を振り返りつつ、時代の流れと共に変化したユースケースやベストプラクティスに着目し準備を進めました。実際の出題でも、問われる本質はあまり変わりなく、サーバレス・マネージドサービスについての問いが多くなっていたような気がします。 -
動画学習サイトの活用
英語力は必要となりますが、網羅的な試験対策コースがあります。動画を視聴する時間はそれなりに取られます。何れかのサイトを利用しておくと試験前の安心感が得られると思います(サイトのみの紹介、コースはお好みで)
なお、上記に記載しました通り認定でカバーする範囲はほぼ、「データアナリティクス」=「ビックデータ」 ですので、どちらかのキーワードのコースであればそれで十分かなと思います。
抑えるべき3つのポイント
1. 2020年4月時点のデータアナリティクス分野のAWSベストプラクティス
-
これに尽きると思い試験準備を進めました。基本的には、ビッグデータ専門知識と扱うスコープは一緒なのですが、ブラックベルトの各資料では、Glue、QuickSight、Athena、Redshift Spectrum を使うユースケースが推されているように感じました。以下、今回の受験の際に参考としたドキュメント群を紹介します。
-
AWS サービス別資料
:Analyticsのカテゴリのドキュメント群は必読です。設問の内容・レベルもブラックベルトを理解できれば十分だと思います。ただし、CloudSearchだけは、私の観測範囲では出現しなかったような気がします。 -
AWS 認定試験 準備ページ:こちらの、「データ分析 – 専門知識」のカテゴリに詳細な試験準備内容が記載されています。ここのページには親切にも、試験で出てくると思われる各AWSサービスが明示されていますので、初受験の方はこちらを参考にされると良いかと思います。今回私は「AWSホワイトペーパーおよびよくある質問を読む」でリンクが貼られているドキュメントにざっと目を通しました。
2. 普遍的ななETL関連サービスはしっかりと
- Kinesis(KDS、KDF、KDA)のユースケース、EMR可用性、KMSでの暗号化、ETL中間処理としてのLambdaのできること・できないこと、クエリ要件に対する Redshift vs Athena vs Redshift Spectrum、可視化実現手段 QuickSight vs Kibana。目新しいものではないのですが、ブラックベルトの粒度で十分ですのでしっかりとした理解が必要です。
3. パフォーマンス問題のトラブルシューティング
- こちらはいくつかの設問で散見されました。具体的には、Redshift COPYコマンド高速化、Athenaクエリのデータレイクの格納ファイル形式によるクエリ性能の違い(csv、json、parquet、orc)、KDSのシャード・リシャード・バーティションキー。パフォーマンス問題については設問の制約条件をしっかり読み解く必要があります。
おわりに
AWSサービスは常にアップデートされ続けており、継続したキャッチアップは必要不可欠と考えています。ちょうど日本時間では本日から、AWS re:Invent 2020 も開催され、新たなサービスの発表があるやもしれません。
AWS認定の維持に関わらず、過去から未来への流れを把握するうえで、定期的な知識の棚卸しは大事なのかなと思います。
今後受験を検討される方の一助になれば幸いです。
著者関連リンク
- AWS認定ビッグデータ専門知識(BDS)を、1ヶ月の準備期間で取得した試験準備やったことまとめ
- AWS認定セキュリティ専門知識(SCS)を、1年の空白期間を経て取得したやったことまとめ
- AWS認定機械学習専門知識(MLS)を、2ヶ月の集中期間で取得したやったことまとめ
- AWS認定高度なネットワーキング専門知識(ANS)を、3ヶ月のハンズオン期間を経て取得したやったことまとめ
- AWS認定データベース専門知識(DBS)を、ほぼぶっつけ本番で取得したやったことまとめ
- AWS認定Alexaスキルビルダー専門知識(AXS)を、ツンデレメイドスキルを作りながら取得したやったことまとめ
- AWS 認定クラウドプラクティショナー(CLF)を、これまでの振り返りを兼ねて取得したやったことまとめ