1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【個人用】AWS Solution Architect Associate 自分用ノート(分析編)(随時更新)

Last updated at Posted at 2025-01-14

扱う内容

・Kinesis
・EMR
・Glue
・Athena
・Data Pipeline

EMRの基礎知識

・ビッグデータの分析や処理を行うサービス

・ビッグデータ処理用のフレームワークであるHadoopSparkを用いている

・3つのノードを持ち、分散処理を行う

・データの保存先にはHDFSEMRFSいうファイルシステムを利用する。HDFSはEMRクラスター終了時にデータが吹っ飛ぶが、EMRFSはデータが永遠に保存される

Glueの基礎知識

・複数のデータソース(S3やDynamoDB)からデータを抽出し、変換・統合したデータをターゲット(Redshiftやオンプレミスなど)に渡すという、データ分析における橋渡しの役割を果たす

クローラーがデータソースからデータを抽出し、まとまりであるデータカタログを作成する

・データカタログを基に、ETLエンジンがデータソースからデータを抽出し、ターゲットに渡す

・データカタログは。EMRやAthenaなどの分析サービスからも参照できる

Athenaの基礎知識

・サーバーレスである

・あらかじめCSVやJSONなどのデータを基にテーブルを作成することで、クエリを実行できるようになる

Data Pipelineの基礎知識

S3からDynamoDBへのデータ取り込みなど、データの移動や変換を自動化するサービス
EC2インスタンスを移動して使うので、サーバーレスではない

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?