はじめに
今はAWSソリューションアーキテクトプロフェッショナル試験(以下、SAP)の勉強しています。
勉強中に学んだことを記事にしていこうと思います。
セキュリティグループとネットワークACL
セキュリティグループは、EC2、ELB、RDSなどのインスタンスに適用するファイアウォール機能です。
ネットワークACLは、サブネットに適用するファイアウォール機能です。
セキュリティグループ | ネットワークACL | |
---|---|---|
適用先 | インスタンス | サブネット |
制御項目 | プロトコル(TCPやUDPなど)、ポート範囲、CIDR、セキュリティグループ | プロトコル、ポート範囲、CIDR |
デフォルトの状態 | 全てのアクセスを拒否 | 全てのアクセスを許可 |
状態(ステート)の保持 | ステートフル (応答トラフィックはルールに関係なく許可) |
ステートレス (応答トラフィックはルールを明示して許可 |
その他 | インスタンスには少なくとも1つのセキュリテイグループをアタッチする必要がある | --- |
AWS Storage Gateway
ゲートウェイタイプ | S3での保存単位 | プライマリデータの保存場所 |
---|---|---|
ファイル | ファイル | S3 |
ボリューム (キャッシュ型) |
ボリューム | S3 |
ボリューム (保管型) |
ボリューム | ローカルディスク |
テープ | 仮想テープ | ローカルディスク |
分析系?のAWSサービス
分析系?のAWSサービスの違いがよくわかっていないので、まとめてみる。
Amazon Redshift
Redshiftは、データを標準SQLで分析可能なデータウェアハウス向けのデータベースサービスです。データベースは、データの保存や編集など様々な機能を持ちますが、データウェアハウスはデータの分析に特化しています。
- S3に保存された大容量のデータをRedshiftを使用して分析できる
Amazon EMR (Elastic MapReduce)
EMRは、分散処理フレームワークです。
- Hadoop、Spark、Prestoなどの分散処理フレームワークをサポートする
- EMRは、マスターノード、コアノード、タスクノードの3種類のノードで構成される。コスト削減する場合、マスターノードとコアノードはオンデマンドインスタンス、タスクノードはスポットインスタンスを使用する
- EMRは、1秒ごとの請求
Amazon Athena
Athenaは、S3内のデータに対し、標準SQLを実行して分析するクエリサービスです。
- RedshiftやEMRとの違いとして、AthenaはノードやEC2を持たない。S3内のデータをクイックに分析したいユースケースに向いている。Athenaは内部的にはPrestoを使用しているので、EMRでPrestoを使用した場合と同じような処理が可能です。
Amazon QuickSight
QuickSightは、データ可視化サービス(BIサービス)です。
- データソースはS3、RDB、Redshift、Athenaなど