4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

DynamicFrameをRedshiftにロードする際のファイル形式にParquetを指定するとError code 15007が発生する

Last updated at Posted at 2024-11-05
error:  Spectrum Scan Error
code:      15007
context:   File 'https://s3.ap-northeast-1.amazonaws.com/xxx.snappy.parquet' has an incompatible Parquet schema for column 's3://xxx
query:     00000
location:  dory_util.cpp:1671
process:   worker_thread [pid=000]

デフォルトはCSVで、Parquetに変更することでエラーが発生する。

原因1

CSV形式
  • データはテキストとして保存される
  • 各フィールドは文字列として扱われ、データ型の情報は含まない
  • Redshiftにデータをロードする際、必要に応じてデータ型のキャストや変換が自動的に行う
Parquet形式
  • データとともにスキーマ情報(データ型、列名など)を持つ
  • 各フィールドのデータ型が明示的に定義され、厳密に管理される
  • Redshiftにデータをロードする際、ParquetファイルのスキーマとRedshiftテーブルのスキーマが完全に一致する必要がある
4
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?