LoginSignup
0
0

More than 3 years have passed since last update.

AWS DataPipelineに関して

Posted at

AWS Data Pipelineとは

AWS DataPipelineとはデータの移動や変換を自動化できるウェブサービスになります。DataPipelineは保存場所にあるデータに定期的にアクセスし、必要なスケールのリソースを使用して変換と処理を行っていきます。

実際に触ってみる。

それではさっそく触っていきたいと思います。

ロールの作成

まずは二つのロールを作成します。IAMのロールのところからロールの作成を選択し作成します。2020-10-02 (2).png
2020-10-02 (3).png

DynamoDB テーブルの作成

DynamoDBに以下のようなテーブルを作成しました。
2020-10-02 (4).png

S3バケットの作成

DynamoDBデータをエクスポートする先になるS3バケットを作成します。
2020-10-02 (5).png

パイプラインの作成

Data Pipelineを作成します。
Name:自分自身で設定
Source:Build using a templateを選択しExport DynamoDB table to S3を選択します
Parameters:ここでDynamoDBにあるS3にExportしたいテーブルを選択し、Export先のS3のフォルダを指定します。DynamoDBのRegionも間違えないように設定をします。
2020-10-02 (6).png

Pipeline configuration:ここでlogを出力するバケットを指定します。
2020-10-02 (7).png

Acitveを行いStatusがFinishedになるまで待ちます。
2020-10-02 (8).png

S3にあるか確認する

S3バケットにデータがあるか確認してみます。実際にバケットに移動してみると以下のようなファイルが作成されていました。しっかりとデータが入っているのかを確認するためにエディタで確認してみます2020-10-02 (10).png

しっかりとデータが入っているのかを確認するためにエディタで確認してみます。そうするとしっかりとデータがS3にエクスポート出来ているのが分かります。2020-10-02 (9).png

<参考資料>
AWSエンジニア入門:AWS Data Pipelineとは
AWS再入門 AWS Data Pipeline編
AWS Data Pipeline を使用して DynamoDB データをエクスポートおよびインポートする

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0