お疲れさまです。
表題の試験に合格したため記録として残したいと思います。
注意点
本試験は2020年4月12日に「ビッグデータ」から「データ分析」へ生まれ変わります。
そのため、当該日を過ぎてからこの記事や他の方の過去記事を参考にされると出題範囲が大きく異なる可能性があります。
結果
合格(※スコアレポートが戻り次第追記予定)
分野 | 名称 | 割合 |
---|---|---|
1 | 収集 | 17% |
2 | 格納 | 17% |
3 | 処理 | 17% |
4 | 分析 | 17% |
5 | 可視化 | 12% |
6 | データセキュリティ | 20% |
所有資格
資格名 | 取得年月日 |
---|---|
AWS Certified Solutions Architect - Associate (SAA) | 2018-06-14 |
AWS Certified SysOps Administrator - Associate (SOA) | 2018-06-22 |
AWS Certified Developer - Associate (DVA) | 2018-06-25 |
AWS Certified Solutions Architect - Professional (SAP) | 2018-07-19 |
AWS Certified DevOps Engineer - Professional (DOP) | 2020-02-19 |
AWS Certified Big Data - Speciality (BDS) | 2020-03-23 |
事前知識
過去にGCPのデータエンジニア試験を受験していたこともあり、覚えのある内容がいくつかあったこともアドバンテージになりました。
所感
基本的にはHadoopエコシステムの特徴とビッグデータに分類されるサイズ感に対応したAWSリソース、機械学習の基礎知識があれば合格ラインが見えると思います。
受験者に向けたアドバイス
- HDFS, HBase, MapReduceなどの特徴を理解する
- Presto, Spark, Pig, Sqoop, Phoenix, Hiveなどの特徴を理解する
- Kinesisの種類とそれらがどんな要件に適していてどのリソースと親和性が高いのか理解する
- DynamoDBとRedshift、RDSの明確な違いを理解する
- ストリーミングからの分析や可視化のアプローチに対して、状況ごとにどう組み合わせるか理解する
- 機械学習モデルとしての回帰、カテゴリ、バイナリなどの傾向を把握する
まとめ
実質一週間で準備した割にはある程度時間を余らせて合格できました。
ビッグデータに全く触れたことがない方は、まず関連書籍を一冊読んでから
上記のワードが何を意味してどこまで対応できるのかを比較できるよう、情報整理を始めることが理解を早める方法になるかもしれません。
次はセキュリティか機械学習あたりを4月中に取れるよう頑張っていこうと思います。