はじめに
この記事はAWS SAA試験勉強のための、Redshiftに関する知識のまとめです。
Redshiftとは
Amazon Redshift は、 クラウド内でのフルマネージド型、ペタバイト規模のデータウェアハウスサービス。
基本的性質
Redshiftはスナップショット用に無料ストレージを提供していますが、上限のストレージ容量を超過すると課金が発生します。
Redshiftは主にクラスターの起動時間に応じて課金が発生しますが、バックアップとなるスナップショットも含めたデータ量に応じても料金が高くなります。
Amazon Redshift Spectrum
Amazon Redshift Spectrumを使うことで、Redshiftへのアップロードを行わずにS3バケット上に保存されたファイルに対して直接、高度なクエリ処理を実行することが可能になります。
Amazon Redshift Spectrumを使用することにより、外部テーブルを結合し、変換済クリックストリームデータを照合することがあります。
Work Load Management(WLM)
Redshiftのクエリ処理に対して割り当てるRedshiftのリソースを指定する機能。
WLMを利用することでクエリ処理をキューに登録して実行順序を定義することが可能となります。
拡張VPCルーティング
Redshiftクラスターに対する拡張VPCルーティングを有効にすることで、VPCに出入りするRedshiftクラスターのすべてのCOPYおよびUNLOADトラフィックを監視することができます。
インターネットに出ないでS3とRedshiftを接続する際は、Amazon S3 VPCエンドポイントを構成し、Redshift拡張VPCルーティングを有効にします。
スナップショット
Redshiftは暗号化されたSSL接続を使用して、スナップショットをS3に保存できます。
Redshiftのスナップショットには手動と自動の2つのタイプがあります。
手動スナップショットはいつでも取得でき、クラスターを削除した後も継続して保持されます。
Redshiftはスナップショット用に無料ストレージを提供していますが、上限のストレージ容量を超過すると課金が発生します。つまり、スナップショット容量が上限に達すると課金されてしまいます。 そのため、自動スナップショットの保存期間を見直して古いスナップショットが削除されるようにしたり、自動スナップショットと併用している手動スナップショットを削除することでスナップショットの保存料金を削減することができます。
スナップショットは異なるリージョンへ保存することもできます。これをクロスリージョンスナップショットと呼びます。
異なるリージョンへとったスナップショットからRedshiftクラスタを再構築できるので、DRや異なるリージョンでRedshiftクラスタを構築する場合に有効です。
Leaderノード
各クラスタに一台だけ存在するLeaderとなるノードです。
アプリケーションなどからのリクエストを受け付けて各Computeノードへ割り振り、またその結果を取りまとめてアプリケーションへ返す役割を果たします。
Computeノード
Leaderノードからの命令を処理するノードです。
サードパーティーとの接続
※勿論Amazon QuickSightとも連携できます。