EMRとは
- Elastic MapReduc
- 膨大なデータを分析・処理するためのHadoopクラスタ(ビッグデータ)の構築を支援
- クラスタは数百台のEC2インスタンスで構成
オートスケーリングやSpotInstanceと統合 - Apache Spark, HBase, Presto, Flink などに対応
- EMRがプロビジョニングや構成設定をしてくれる(マネージド)
- オートスケーリングやSpotインスタンス
データストア
S3, DynamoDB, Redshift などのデータストアが利用可能
EMRとRedshiftとの違い
- 試験の選択肢としてEMRとRedshiftが同時に出てくることが多い
- EMRはビッグデータ分散処理のためのフレームワーク
非構造データも扱える - Redshiftはビッグデータの収集・分析・集計
構造データのみを扱う