LoginSignup
0
0

More than 3 years have passed since last update.

AWS Glueジョブで変換後のファイルが複数出来る際に見るページ

Last updated at Posted at 2020-09-03

はじめに

AWS Glueジョブ実行後の結果を見ると、複数ファイルが出来てしまいました。
1つでいいんだが!と思い、1つにまとめる方法について調べました。

repartitionをしよう

DynamicFrameでもDataFrameでも同じやり方でOKです。
どちらのクラスにもrepartitionという分割し直しをしてくれるメソッドがあり、それを使うことで変換後のファイルもその数で出力してくれます。

自動生成したスクリプトを修正した例を載せておきます。

glueContext.create_dynamic_frame.from_catalog(database = "default", table_name = "data_source", transformation_ctx = "datasource0").repartition(1)

分割したい数は指定可能なので、もっと分割したいよということであれば数字部分を変更してください。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0