GCP(Google Cloud Platform)のProfessional Data Engineer 認定資格に2021年12月に合格したので、勉強方法を共有します。
試験概要
試験ガイドを読み込み出題範囲を理解する。
勉強方法
Coursera
CourseraにてGoogle Cloudが提供しているプロフェッショナル認定がある。資格合格に必要なこと内容がほとんど充足している。
下記、6つのコースが入ったものとなっている。
- Google Cloud Big Data and Machine Learning Fundamentals
- Modernizing Data Lakes and Data Warehouses with Google Cloud
- Building Batch Data Pipelines on GCP
- Building Resilient Streaming Analytics Systems on Google Cloud
- Smart Analytics, Machine Learning, and AI on GCP
- Preparing for the Google Cloud Professional Data Engineer Exam
書籍
GCP全体のサービス概要の知識習得して以下書籍がおすすめです。
AIやGCPを用いたデータ分析構築関連などこの試験にフォーカスした書籍として以下がおすすめです。
Udemy
模擬試験よりやや難しいが、日本語で試験を受けるときの独特な日本語訳感は模擬試験よりこっちが近い。
問題数も多く理解している部分を広く確認することができる。
模擬試験
模擬試験を提供しているで腕試しに。
理解が十分なところ不十分なところの把握および実際の試験の感じがわかる。
模擬試験では結果と簡易な解説しかないので、詳細な解説が欲しい場合に。
TIPS
状況に応じた最適なサービス、ベストプラクティスなサービスを選択するに当たって似たようなサービスの違いやメリット/デメリットを理解する。
Google Cloudの下記に記載するサービス群は試験ではコアとなる部分なので、公式ドキュメントの概要やはじめに、ベストプラクティスを一読することをおすすめです。
データベース、ストレージサービス
Firebaseサービスは範囲外なので不要だが、モバイル向けの場合に該当する。どの場面でどのサービスが選択すべきか理解が必要。
- Cloud Storage
- Cloud SQL
- Cloud Spanner
- Datastore(Firestore)
- Cloud Bigtable
- BigQuery
データ処理サービス
EL/ELT/ETLと呼ばれるサービス。似ているものが多いので違いを理解する必要がある。
-
Dataproc
GCP上でHadoopやSparkを動かせられる。GCE部分はマネージドで提供。 -
Datafusion
DataprocのGUIバージョン。 -
Dataflow
GCPの推しサービス。 -
Dataprep
DataflowのGUIバージョン。
メッセージングサービス
保存期間やスケールしやすさなどの違いがある。
- Cloud Pub/Sub
- Apache Kafka