はじめに
AWS認定ビッグデータ専門知識(BDS)について、受験者数の絶対数が少ないのか試験対策に関する参考記事の投稿が少なく情報収集に苦労しました。
今回、2019年のお盆休みを主に利用して短期で取得できた試験準備のコツなどについてまとめてみました。ビッグデータ専門知識に関わるAWS関連サービスのイメージを掴んでいただければ幸いです。
本記事の主な対象者
- AWS認定の他の試験区分は取得済みで、ビッグデータ専門知識の受験を検討している方
- 取得に向けて有効な学習方法などの情報収集したい方
筆者のAWS認定履歴
|AWS認定 |取得日 |
|---|---|---|
|ソリューションアーキテクト - アソシエイト |2018-05-13|
|デベロッパー - アソシエイト |2018-06-03|
|SysOpsアドミニストレーター - アソシエイト | 2018-06-10|
|ソリューションアーキテクト - プロフェッショナル |2018-07-29|
|DevOpsエンジニア - プロフェッショナル |2018-08-26|
|ビッグデータ専門知識 |2019-08-25|
昨年は、自分自身としての re:Invent2018 エントリー要件として受験し、4ヶ月ほどで5区分を一気に取得しました。
今回の受験モチベーションは、AWS Summit Tokyo 2019に参加して、今年はAWSとして機械学習分野を推している雰囲気があり、そのプリプロセスとしてのビックデータの扱いについて体系立てた学習をしてみたくなったのがきっかけです。
今回のスコア(2019-08-25受験)
総合成績: 76%
分野別の成績 :
1.0 収集: 62%
2.0 格納: 77%
3.0 処理: 75%
4.0 分析: 87%
5.0 可視化: 71%
6.0 データセキュリティ: 80%
やはり業務で関わっている分野のスコアは高く、そうでない分野は低い傾向でした。
AWS認定ビッグデータ専門知識(BDS)について
ここからが本題となります。
まずは、以下の公式ページから試験概要の把握を行いました。
少し困ったこと
公式ページにおいて、ビッグデータ専門知識のみ他の試験区分と以下の点が異なりました。
- サンプル問題が全て英語
- AWS公式のオンライン模擬試験がない
具体的な試験準備で効果があったと思えること
実際に受験をしてみて、試験対策として効果があったと思う内容について、主観的な効果度合いで順に記載します。
-
AWS サービス別資料 (旧ブラックベルト)
分野毎に、理解したと思えるレベルまで繰り返し読みこみました。- 収集:Kinesis, IoT, SQS
- 格納:S3, DynamoDB
- 処理:EMR, Glue, Lambda
- 分析:Redshift, Athena, (ML)
- 可視化:QuickSight
- データセキュリティ:IAM, Cognito , KMS, CloudHSM
-
re:Invent 2017: Big Data Architectural Patterns and Best Practices on AWS
上記のサービス別資料単体では深く表現していない、AWSサービス間の横串連携について詳しく説明されていました。特に意識すべきは以下の点です。- リアルタイム、インタラクティブ、バッチの各ビックデータ処理プロセスにおいて、選択すべきAWSのサービスは何か
- アンチパターン
- Summaryのスライド上に記載されている、AWS、オープンソース、3rdパーティツールの基本的な知識(結構重要なポイント)
-
動画学習サイトの活用
英語力は必要となりますが、網羅的な試験対策コースがあります。動画を視聴する時間はそれなりに取られます。AWS公式のオンライン模擬試験が無い試験区分なので、何れかのサイトを利用しておくと試験前の安心感が得られると思います(サイトのみの紹介、コースはお好みで)
その他試験TIPS
私見を多分に含むメモです。キーワードの参考に。
- Kinesis
- Kinesis Streams は、ストリームストレージという概念とその構成要素
- Kinesis Streams と、Kinesis Firehose のユースケースの明確な違い
- DynamoDB
- 他のサービスから、メタデータの格納先として内部的に使われているということ
- 毎度毎度のホットパーティション問題とその本質の構成要素
- EMR
- Hadoopクラスタに関する理解
- Hive、Presto、Sparkなど、re:Invent動画内で紹介されているものは要チェック
- Redshift
- パフォーマンスに影響を与える構成要素
- COPY、UNLOADコマンド
- ML
- 教師ありなし、ラベル、モデル(バイナリ、マルチクラス、回帰)に関する基本的な理解
- QuickSight
- ビジュアルタイプ(円グラフ、折れ線グラフ等)毎の可視化要件に対するユースケース
おわりに
スポーツに例えると、「正しい位置で、正しい方向に向かって、正しく素振りする」ことが、短期上達のコツかと思い、試験対策に取り組みました。
今後受験を検討される方の一助になれば幸いです。