基本的なシステム構成図を理解するためのAWS基礎をまとめてみた


はじめに

最近、AWSのシステム構成図を見ることが多くなり、AWS上で動いているシステムのシステム構成図を理解できるようになるために個人的に知っておきたいと思ったAWSの用語・サービスをまとめてみました。

私自身も勉強がてら作成したので、わかりづらい部分も多くあると思いますが、AWSのサービス全くわからん→なんとなく雰囲気把握した、となっていただけたらと思います。

2018年10月に新しくなったAWSアーキテクチャアイコンを使用しています。

サーバ・クライアントなどの説明についてはここではしていませんが、以下の記事でとてもわかりやすくまとめてくださっています!

超絶初心者のためのサーバとクライアントの話


知っておきたい用語


リージョン


  • AWSがサービスを提供している拠点(国と地域)

  • リージョン同士はそれぞれ地理的に離れている(例えば日本とオレゴンとか)

  • 日本はap-northeast-1(リージョン名はアジアパシフィック(東京))


アベイラビリティゾーン


  • リージョン内のさらに細かい拠点

  • 1つのアベイラビリティゾーンは複数のデータセンターから構成されている

  • ap-northeast-1には3つのアベイラビリティゾーンがある(a,c,d なぜかbが無い)

  • ごく稀にアベイラビリティゾーン全体で障害が発生することがあり、その時にリソースが1つのアベイラビリティゾーンに固まっているとサービスが停止してしまうため、アベイラビリティゾーンをまたがってインスタンスを配置する設計にする必要がある


リージョンとアベイラビリティゾーンの関係性

リージョンとアベイラビリティゾーン.jpeg


主なサービス


VPC


  • Virtual Private Cloudの略

  • AWSの中のプライベートゾーンのようなもの

  • VPCを使うことで、AWS内にプライベートなネットワークを作成できる

  • 自由にIPアドレス(CIDRブロック)を割り当てることができる
    VPC.jpeg


サブネット


  • VPCのさらに内側につくる、EC2インスタンス(※後述)などを起動するための領域

  • VPCに設定したCIDRブロックに収まるCIDRブロックを割り当てる

  • サブネット作成時にアベイラビリティゾーンを指定する

  • パブリックサブネットとプライベートサブネットがあり、それらの違いはインターネットゲートウェイ(※後述)から直接アクセスできるかできないかである(アクセスできるのがパブリックで、アクセスできないのがプライベート)
    subnet.jpeg


ルートテーブル


  • サブネット内のインスタンスの通信先のルール(サブネットがどこと通信するか)を定めた表のようなもの

  • 個々のサブネットに1つずつ設定する

  • 各サブネットをルートテーブルに関連付ける必要がある(指定しない場合はデフォルトのルートテーブルになる)

  • ルートテーブルで、サブネットの通信先にインターネットゲートウェイを指定することで、サブネットがインターネットに接続できる
    ルートテーブル.jpeg


ゲートウェイ


  • VPCの内部と外部との通信をやり取りする出入り口


インターネットゲートウェイ


  • VPCとインターネットを接続するためのゲートウェイ

  • 各VPCに1つだけ取り付けられる


NATゲートウェイ


  • プライベートIPしか持っていないEC2インスタンスがインターネットと通信できるようにするためのもの

  • プライベートIPをNATゲートウェイが持つグローバルIPに変換し、外部と通信する


ゲートウェイエンドポイント


  • S3やDynamoDBといったVPCの中に入れられないサービスに、VPC内から接続する際に利用する

ゲートウェイ.jpeg


EC2


  • Amazon Elastic Compute Cloudの略でAWSの基幹サービス

  • 仮想サーバを提供する

  • 仮想サーバの1つ1つの実体は「インスタンス」と呼ばれる

  • EC2インスタンス≒サーバ という感覚

  • ボタンワンクリックでインスタンスをつくることができるので便利

  • クライアントからのリクエスト数が増えたらインスタンスの数を増やしたり(スケールアウト)、インスタンスの性能を上げたり(スケールアップ)も簡単にできるため、サーバ調達のための時間やコストを削減できる
    EC2.jpeg
    スケールアップとスケールアウト.jpeg


ELB


  • Elastic Load Balancingの略

  • その名の通りロードバランサーのマネージドサービス(管理とかを一括して請け負ってくれるサービス)

  • ロードバランサー→サーバへの負荷を分散させるやつ

  • EC2インスタンスがスケールアウトされて複数ある場合、ELBがクライアントからリクエストを受け取り、それを各インスタンスに分散させる

  • ELB自体もスケーリングができ、負荷に応じてスケールする設計になっている


ELBの種類


  • Classic Load Balancer(CLB)


    • L4/L7レイヤーで負荷分散を行う。現在はあまり使わない。



  • Application Load Balancer(ALB)


    • L7レイヤーでの負荷分散を行う。CLBより後に登場。



  • Network Load Balancer(NLB)


    • L4レイヤーでの負荷分散を行う。HTTP以外のプロトコル通信の負荷分散をしたい時に利用する。
      ALB.jpeg




RDS


  • RDB(リレーショナルデータベース、関係データベース)と呼ばれる、SQL文でデータを操作するデータベースのマネージドサービス

  • Amazon Aurora、MySQL、MariaDB、PostgresSQL、Oracleなどのデータベースエンジンから好きなものを選べる

  • データ保存用ストレージはEBS(Elastic Block Store)を使用している

  • インターネットからの接続はデフォルトでオフになっている(多分セキュリティを保つため)ため、EC2などの他のAWSサービスから通信することが多い
    RDS.jpeg


マルチAZ構成


  • 1つのリージョン内の2つのアベイラビリティゾーンにDBインスタンス(データベースの実体)をそれぞれ配置する構成

  • 1つのアベイラビリティゾーンで障害が発生しても、もう一つのアベイラビリティゾーンが生きていればシステムのダウンタイムを短くすることができる

  • DBインスタンス作成時にマルチAZ構成を選択したら、あとはAWSが勝手に冗長化してくれて便利


S3


  • Simple Storage Serviceの略

  • 容量無制限のストレージ(補助記憶)サービス

  • なんかめっちゃ色々なものが大量に入る箱のようなもの

  • 保存するファイルにメタデータを追加し、「オブジェクト」として管理する

  • S3に保存されている各オブジェクトには、RESTやSOAPといったWeb APIでアクセスする

  • データのバックアップや、静的コンテンツ(HTMLファイルなど)のホスティング(置き場)としても利用される

  • VPCの中には入れられないため、ゲートウェイエンドポイントを通じてVPC内のEC2インスタンスと通信する
    S3.jpeg


バケット


  • オブジェクトを保存するための領域

  • バケット名はAWS内(全世界)で一意にしなければならない


オブジェクト


  • S3に格納されるデータそのもの

  • 各オブジェクトには必ず一意になるURLが作成される


Route53


  • DNSのサービス

  • ドメイン管理機能と権威DNS機能を持つ


    • 権威DNSとは、ドメイン名とIPアドレスの変更情報を保持しているDNS



  • DNSのポート番号が53であることからこの名前が付いている


CloudFront


  • 静的コンテンツをキャッシュして配信するサービス

  • ロードバランサーの前段に配置し、元のサーバにあるデータをキャッシュしておく(記憶しておく)ことで、次回に同じリクエストが来たらキャッシュしたものを返す


    • サーバの負荷を軽減できる

    • 利用者から最も近いロケーションからコンテンツを高速に配信することができる



  • キャッシュの期間は拡張子やURLごとに設定することができる


    • 頻繁にアップデートされるコンテンツはキャッシュを短くし、あまり更新されないコンテンツは長くするなど
      CDN.jpeg
      CloudFront.jpeg




オーソドックスなアーキテクチャ


  • 簡易的なブログのシステム構成図を想定

  • S3にはエラーページなどの静的コンテンツを配置
    システム構成図.jpeg


参考資料

以下を参考にさせていただきました。ありがとうございました。