0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

SerDeとは

Last updated at Posted at 2024-08-16

SerDeとは

「SerDe」とは、シリアライズ(serialize)およびデシリアライズ(deserialize) を行うためのライブラリです。これにより、データを特定の形式に変換して保存したり、保存されたデータを元の形式に戻したりすることができます。

AthenaでSerDeを使う

Athenaで利用できるSerDeは以下。

Amazon Ion Hive SerDe

ライブラリ名: com.amazonaws.athena.serde.IonHiveSerDe
説明: Amazon IonはJSONのスーパーセットで、リッチタイプの自己記述データ形式です。

Avro SerDe

ライブラリ名: org.apache.hadoop.hive.serde2.avro.AvroSerDe
説明: Apache AvroはJSONベースのスキーマを使用するデータ形式で、Hadoopにデータを保存するために使用されます。

Parquet SerDe

ライブラリ名: org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
説明: Apache Parquetは列指向のストレージ形式で、Hadoopのデータを効率的に保存します。

Grok SerDe

ライブラリ名: com.amazonaws.glue.serde.GrokSerDe
説明: Grokパターンを使用して、LogstashログやApache WebServerログなどのデータを解析します。

Regex SerDe

ライブラリ名: org.apache.hadoop.hive.serde2.RegexSerDe
説明: 正規表現を使用してデータを解析します。

Hive JSON SerDe

ライブラリ名: org.apache.hive.hcatalog.data.JsonSerDe
説明: JSON形式のデータを処理します。

OpenCSVSerDe

ライブラリ名: org.apache.hadoop.hive.serde2.OpenCSVSerde
説明: CSVデータを処理します。

LazySimpleSerDe

ライブラリ名: org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe
説明: CSV、TSV、カスタム区切りファイルのデータを処理します。

ORC SerDe

ライブラリ名: org.apache.hadoop.hive.ql.io.orc.OrcSerde
説明: ORC(Optimized Row Columnar)形式のデータを処理します。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?