データウェアハウスに関する基本的な内容をまとめてみたものです。データウェアハウスに関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
RedShiftの特徴が生きる用途
RedShiftの特徴が生きる用途・生きない用途
Amazon Redshift は、高速・高機能のフルマネージド型のデータウェアハウスサービスです。
大規模なデータを処理するのが得意ですが、少量のデータを扱ったり度々データを更新する作業には向いていません。
RedShiftの特徴が生きる用途
・扱うデータセットが数百GB以上の場合
・複雑なSQLを使用するが、同時に実行するSQLの数が少ない
・データの更新を度々行わず、一括で導入する
・これらのことから、RedShiftはデータウェアハウスとして使うのが最適
RedShiftの特徴が生きない用途
・データ量が少ない
・SQLを同時に複数動作させる場合
・データを更新する頻度が多い
・RedShiftに向かない作業については、Amazon DynamoDB・Amazon ElastiCache・一般的なリレーショナルデータベースの使用が適している
AWSの各種サービスの中でのRedShiftの位置付け
AWSには、特徴のある4つのデータ・ストアが提供されています。
4つのデータ・ストアは、SQLとNoSQLに分類できます。
SQL
Amazon RedShift
・大量のデータの集計と分析を高速で行うデータウェアハウスです
・BIツールなどを使って企業活動のための分析などに使われます
Amazon RDS
・クラウド上のリレーショナルデータベースが必要な時に、便利に使えるデータベースです
・MySQL・PostgreSQL・Oracle・MS SQL Serverから選択できます
NoSQL
Amazon DynamoDB
・大規模なデータを処理する場合でも、レイテンシンを低く抑えられるKVSです
・複雑な処理をするは得意でありませんが、大量のデータを処理するのに向いています
Amazon ElastiCache
・完全マネージド型のメモリキャッシュです
・WEBアプリケーションを高速で動かしたい時に使います