データウェアハウスに関する基本的な内容をまとめてみたものです。データウェアハウスに関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
[RedShiftの特徴が生きる用途] (https://www.techcrowd.jp/redshift/usage/)
[RedShiftの特徴が生きる用途・生きない用途] (https://www.techcrowd.jp/redshift/usage/)
Amazon Redshift は、高速・高機能のフルマネージド型のデータウェアハウスサービスです。
大規模なデータを処理するのが得意ですが、少量のデータを扱ったり度々データを更新する作業には向いていません。
RedShiftの特徴が生きる用途
・扱うデータセットが数百GB以上の場合
・複雑なSQLを使用するが、同時に実行するSQLの数が少ない
・データの更新を度々行わず、一括で導入する
・これらのことから、RedShiftはデータウェアハウスとして使うのが最適
RedShiftの特徴が生きない用途
・データ量が少ない
・SQLを同時に複数動作させる場合
・データを更新する頻度が多い
・RedShiftに向かない作業については、Amazon DynamoDB・Amazon ElastiCache・一般的なリレーショナルデータベースの使用が適している
[AWSの各種サービスの中でのRedShiftの位置付け] (https://www.techcrowd.jp/redshift/usage/)
AWSには、特徴のある4つのデータ・ストアが提供されています。
4つのデータ・ストアは、SQLとNoSQLに分類できます。
SQL
Amazon RedShift
・大量のデータの集計と分析を高速で行うデータウェアハウスです
・BIツールなどを使って企業活動のための分析などに使われます
Amazon RDS
・クラウド上のリレーショナルデータベースが必要な時に、便利に使えるデータベースです
・MySQL・PostgreSQL・Oracle・MS SQL Serverから選択できます
NoSQL
Amazon DynamoDB
・大規模なデータを処理する場合でも、レイテンシンを低く抑えられるKVSです
・複雑な処理をするは得意でありませんが、大量のデータを処理するのに向いています
Amazon ElastiCache
・完全マネージド型のメモリキャッシュです
・WEBアプリケーションを高速で動かしたい時に使います