はじめに
今はAWSソリューションアーキテクトプロフェッショナル試験(以下、SAP)の勉強しています。
勉強中に学んだことを記事にしていこうと思います。
セキュリティグループとネットワークACL
セキュリティグループは、EC2、ELB、RDSなどのインスタンスに適用するファイアウォール機能です。
ネットワークACLは、サブネットに適用するファイアウォール機能です。
| セキュリティグループ | ネットワークACL | |
|---|---|---|
| 適用先 | インスタンス | サブネット |
| 制御項目 | プロトコル(TCPやUDPなど)、ポート範囲、CIDR、セキュリティグループ | プロトコル、ポート範囲、CIDR |
| デフォルトの状態 | 全てのアクセスを拒否 | 全てのアクセスを許可 |
| 状態(ステート)の保持 | ステートフル (応答トラフィックはルールに関係なく許可) |
ステートレス (応答トラフィックはルールを明示して許可 |
| その他 | インスタンスには少なくとも1つのセキュリテイグループをアタッチする必要がある | --- |
AWS Storage Gateway
| ゲートウェイタイプ | S3での保存単位 | プライマリデータの保存場所 |
|---|---|---|
| ファイル | ファイル | S3 |
| ボリューム (キャッシュ型) |
ボリューム | S3 |
| ボリューム (保管型) |
ボリューム | ローカルディスク |
| テープ | 仮想テープ | ローカルディスク |
分析系?のAWSサービス
分析系?のAWSサービスの違いがよくわかっていないので、まとめてみる。
Amazon Redshift
Redshiftは、データを標準SQLで分析可能なデータウェアハウス向けのデータベースサービスです。データベースは、データの保存や編集など様々な機能を持ちますが、データウェアハウスはデータの分析に特化しています。
- S3に保存された大容量のデータをRedshiftを使用して分析できる
Amazon EMR (Elastic MapReduce)
EMRは、分散処理フレームワークです。
- Hadoop、Spark、Prestoなどの分散処理フレームワークをサポートする
- EMRは、マスターノード、コアノード、タスクノードの3種類のノードで構成される。コスト削減する場合、マスターノードとコアノードはオンデマンドインスタンス、タスクノードはスポットインスタンスを使用する
- EMRは、1秒ごとの請求
Amazon Athena
Athenaは、S3内のデータに対し、標準SQLを実行して分析するクエリサービスです。
- RedshiftやEMRとの違いとして、AthenaはノードやEC2を持たない。S3内のデータをクイックに分析したいユースケースに向いている。Athenaは内部的にはPrestoを使用しているので、EMRでPrestoを使用した場合と同じような処理が可能です。
Amazon QuickSight
QuickSightは、データ可視化サービス(BIサービス)です。
- データソースはS3、RDB、Redshift、Athenaなど