Redshiftに関する用語をまとめてみました。
1. データ分散・配置関連
用語 | 概要 |
---|---|
ディストリビューションキー (DISTKEY) | Redshiftでデータを分散配置する際に使用するカラムのキー。 |
ディストリビューションスタイル | データをノード間にどのように分散するかを定義する方式。 |
ALLディストリビューション | ディメンジョンテーブル全体をすべてのノードに複製する分散スタイル。 |
2. データ構造・設計関連
用語 | 概要 |
---|---|
ファクトテーブル | ディメンジョンテーブルと結合され、主に大量のトランザクションデータを格納するテーブル。 |
ディメンジョンテーブル | ファクトテーブルと結合され、カテゴリや属性情報を提供するテーブル。 |
主キー (Primary Key) | テーブル内で各行を一意に識別するカラム。 |
外部キー (Foreign Key) | 他のテーブルの主キーを参照するカラム。 |
3. クエリ最適化関連
用語 | 概要 |
---|---|
ソートキー | ディスク上でデータを特定の順序で格納する際に指定するカラムのキー。 |
ソートマージ結合 | ソートされたデータを効率的に結合するためのクエリ最適化手法。 |
ハッシュ結合 | ハッシュ値を基にテーブルを結合するクエリ手法。 |
4. データ管理・性能関連
用語 | 概要 |
---|---|
自動圧縮 | Redshiftがデータの内容を解析して適切な圧縮エンコーディングを自動的に適用する機能。 |