0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

AWS Glue python shell で ETL

Posted at

AWS Glue python shell で ETLジョブ作成する際のハマりどころメモ
2021/1 時点

Glue Python shellとは?

  • GlueのジョブTypeの1つ
  • Sparkを使うまでもない軽いジョブや各種連携に使える
      • DBにSQLを投げる
      • FTPサーバからファイルGET
      • 外部サービスをAPIでキック
      • などなど
  • Python(version2 or 3)で処理を書ける
  • ジョブ実行環境はジョブ毎にサーバレスリソースが割り当てられる(Lambdaのような感じ)
    • 1DPU または 1/16DPU から選べる
    • 1DPUは、4vCPUのコンピューティングと16GBのメモリに相当
    • Lambdaのように時間制約(15分)はない

気になったポイント

[1] VPC内での実行とリソース接続

  • Glueの「接続」機能で接続先リソースやNWを設定しておき、ジョブの設定で紐付けると、該当のセグメント(SG)を起点としてジョブが実行される

[2] 利用できるライブラリ

[3] 外部FTPサーバからのGET処理はできる?

0
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?