はじめに
こんにちは。
先日 AWS認定 データアナリティクス-専門知識 を受験し合格したので、試験勉強を始めるにあたって頭に入れておきたいビッグデータ分析についての基本的な知識について一言でまとめたものを残しておきたいと思います。
ついでに試験対策で使用した参考書についてや、試験を受けた感想も記しておきます。
AWS 認定 データアナリティクス – 専門知識 とは
詳しくは上記リンク先に記載の通りです。以下のような能力が試される試験のようですね。
・AWS データ分析サービスを定義し、それらが相互に統合する方法を理解する
・収集、保管、処理、視覚化のデータライフサイクルに AWS データ分析サービスがどのように適しているかを説明する
ビックデータ分析の知識一言解説
データレイク
データ分析用に加工される前の生データを一元的に保存しているもの。
データウェアハウス
データ分析の目的に合わせて、データが加工された後に保存されているもの。
スタースキーマ
データウェアハウスを構築する際の表現方法の一つ。分析する目的ごとに分類分けされているデータを、中央の「ファクト(事実)」表と分類の軸として使う「ディメンション(次元)」として配置すること。
データマート
部署ごとに分析に利用されるデータはデータウェアハウスの中の一部のみの場合があるため、部署別に分析用テーブルを作成すること。
ETL
データソースからデータを引き出し(Extract)、データウェアハウスで必要な形に整形し(Transform)、データウェアハウスにロード(Load)すること。
データカタログ
データレイクにたまったデータ自体についての情報をまとめたもの。
行指向
テーブルの行ごとにデータをまとめて保持しているもの。CSVやTSV、ApacheAvroが含まれる。
列指向
テーブルの列(=カラム)ごとにまとめて保持しているもの。ParquetやORCが含まれる。
利用した参考書等
AWSではじめるデータレイク
上記の一言解説の参考にもしました。
データレイクの概念から、ビッグデータ分析に利用されるAWSサービスについての詳細・ハンズオンまで載っていて、勉強を始めるにはとてもよい一冊だと思いました。
koiwaclub
言わずと知れたkoiwaclub。
投稿日現在147(7問 × 21題 )問あるので、ある程度は試験対策できると思います。
問題文を見たら解答を即答できるくらいはやりこみましたが、後述しますがkoiwaclubだけだと万全な対策はできないと思った方がいいです。
やっておいた方がよかった対策
blackbelt
こちらも言わずもがなですが、やはり試験前に主要サービスについてある程度読んでおけばよかったと思いました。
試験の感想
koiwaclubでの試験対策を万全にした状態で試験に臨んだところ、自信を持って答えられた問題は20/65でした。
正直初見で問題文を解いていったときにわからな過ぎて絶望してました。
自信がない問題はすべてフラグをつけて、4回くらい見直ししたと思います。
私がいつも試験勉強するときにやってしまいがちな、問題だけをたくさん解いて答えを頭に入れる勉強の仕方をしてしまったので、ちゃんとblackbeltとか見た方がよかったなと思いながら試験を受けてました。
ただ裏を返せばkoiwaclubをやっていれば20問は必ず取れるということなのでやっていて損はないかなという感じです。
かなり絶望していましたが、普段の業務でAWSを扱っていることからサービスの全体像が頭に入っていたのか、はたまた勘が冴えていたのか、ギリギリ合格点を上回っていたのでよかったです。
おわりに
普段ビッグデータ分析の業務に従事していないと、上記であげた用語についてもなんだったっけ?となってしまうことが多々あると思うので、しっかり頭に入れておきたいですね。
他の方の受験記などを読むと真面目に勉強している方がほとんどなのでそこまで参考にはならないかもしれませんが、私の体験談として記録しておきます。
DAS受験をしようとしているどなたかの一助になれば幸いです。