はじめに
IT業界にいると、
「セッションが切れた〜!」「セッションをクリアしよう〜!」「Cookieが切れた〜!」「Cookieに保存して〜!」「キャッシュに残ってる〜!」「キャッシュをクリアしよう〜!」
みたいなエンジニアの声を耳にすること、多いですよね。自分もよく耳にします。
しかし、セッション、Cookie、キャッシュの違い、ちゃんと説明できますでしょうか?
恥ずかしながら自分は、スラスラと説明ができませんでした・・・
なんとなく、「Webサイトの情報を記憶しておくもの」みたいなイメージはありますが、具体的に説明しろと言われると言葉に詰まってしまいます。
そこで今回は、セッション、Cookie、キャッシュの違いについて調べ、記事にすることにしました!!
結論
先にざっくり結論を述べると、
セッション
→複数リクエストを同一ユーザとみなすこと
Cookie
→Webサイトへのアクセス情報を記憶するテキストファイル(セッションを実現するための手段)
キャッシュ
→アクセスしたWebページのページ情報(ファイル)を、ブラウザに一時保存しておく仕組み
という感じです。
以下で詳しく説明します!
セッションとは?
セッションとは、「クライアントとサーバー間で一定期間続く一連の通信や操作のこと」だそうです。
もう少し分かりやすく噛み砕くと、「複数リクエストを同一ユーザと認識させることができる期間」です。
Webページの仕組み
セッションを理解するために、まずはWebページの仕組みを説明します。
Webページはhttpプロトコルを使用してクライアントとサーバ間の通信を行いますが、httpはステートレスになっています。
ステートレスとは、"サーバーへのアクセスが全て新規のアクセスとみなされる"という性質のことです。
例えば、あるユーザが同じブラウザで複数回リクエストをしても、サーバからすると同じユーザと認識できません。
つまりステートレスの下では、
例えば、ブラウザでSNSにログインをした後、別のページを訪れ、再度SNSのページにアクセスすると、ログイン情報が切れてしまします。
不便ですよね・・・
そこで
「複数リクエストを同一ユーザと認識させることができる期間」= セッション
を確立することで、ログイン情報を保ったまま再アクセスが可能になります!
でも、「ステートレスの下でどうやって確立するの?」と思いますよね。
そこでセッションの仕組みについて説明します。
セッションの仕組み
セッションは、セッションIDを、クライアントとサーバ間でやり取りすることで確立します。
セッションIDとは、初回リクエスト時にサーバが発行するランダムなIDになります。
サーバで発行されたセッションIDが、Cookieにのせられて、ブラウザに送られ、2回目以降のリクエスト時には、ブラウザからサーバーにCookieが渡されます。
そして、サーバはCookie内のセッションIDを取り出し、ユーザ情報を取得するわけです。
そもそもCookieとは?
上記の通り、CookieにはセッションIDのような情報を載せることができます。
Cookieの実態は、ユーザがWebページにアクセスしたときにサーバ上で作成されるテキストファイルだそうです。
Cookieの中には、セッションIDの他にも、アクセス日時、訪問回数、ECサイトのカート内の情報など、さまざまな情報を記載することができ、Cookieはサーバで作成された後、ブラウザに送られて保存されます。
なお、Cookieのテキストファイルの中身は以下のように、「Name(項目)」と「Value(値)」の組み合わせでできています。(中身はぼかしてあります)
このCookieにセッションIDを記載し、クライアントとサーバ間でCookieをやり取りすることで、セッションを確立することができます。
Cookieを使用したセッション確立の流れ
以下は、AさんがSNSにログインした時の例です。
<初回ログイン時>
- ブラウザにてAさんが自身のIDとPWで初回ログイン。
- ログインに成功するとサーバにてユーザ情報(Aさん)に紐づくセッションIDとCookieが生成される。
- データストアにセッションIDとユーザの組み合わせが保存される。
- サーバはCookieにセッションID(+その他情報)を記載し、ブラウザに送信し、ブラウザはCookieを保存する。
<次回ログイン時>
5. AさんがSNSのページにアクセスすると、ブラウザがCookieをサーバに渡す。
6. サーバは、Cookie内のセッションIDをデータストアに問い合わせ、ユーザを識別する。
7. Aさんとして自動ログインし、ページを生成する。
このようにして、セッションが確立され、ステートレスの下でも、複数リクエストを同一ユーザからのものと認識させることができます。
セッションのまとめ
上記のように、セッションはCookieとかなり関係しています。
セッションは目的。Cookieはセッションを確立するための手段。と考えるのが良いかと思います!
キャッシュとは?
キャッシュとは、アクセスしたWebページのページ情報を、ブラウザに一時保存しておく仕組みのことだそうです。
これだけ聞くと、Cookieと一緒やん!と思いますが、
Cookieは”Webページへのアクセスの内容”をテキストファイルに保存するのに対し、キャッシュは”Webページに関するファイルそのもの”をブラウザに保存します。
以下は、Yahoo! JAPANのトップページに初回アクセスした時のダウンロードファイルの一部です。
Sizeカラムを見てみると、実際に数KBのファイルが複数ダウンロードされていることが分かります。
ダウンロードしたこれらのファイルをもとにページが生成されます。
次に一度ページを離れ、再度Yahoo! JAPANのトップページにアクセスしてみます。
すると、Sizeカラムにて、先ほど数KBでダウンロードされていた複数のファイルの内いくつかが、”disk cache”や”memory cache”となっていることが分かります。
これは、キャッシュとしてブラウザに保存されたファイルがそのまま使われているということです!
上記のようにキャッシュを使用することで、同一Webページに複数回アクセスした際に、その都度ファイルをダウンロードしなくても、キャッシュに保存したファイルを使用して画面を表示できます!
サーバからファイルをダウンロードする時間より、ブラウザにキャッシュされたファイルを読み込む時間のほうが短いため、Webページの表示スピードの向上を実現できます!
また、通信量も節約できます!
しかし、サーバ側のファイルが更新されたにも関わらず、キャッシュのデータを使用してしまうと、古い内容が表示される場合があります。
そのような場合に備えて、ユーザはブラウザのスーパーリロードを行ったり、開発者は違うファイル名でデプロイしたりと、対策をする必要があります。
また、キャッシュの増加は、端末の動作を重くする可能性があるため、キャッシュの保存量に上限を設けるか、定期的にキャッシュクリアをするなどして、対策することも大切です。
最後に
セッションとCookieとキャッシュについて説明しましたが、ご理解いただけましたでしょうか!
感覚としては、Cookieとセッションは関連性が高く、キャッシュはちょっと別物な感じがしました。
今回、自分なりに調べてみましたが、間違っている点や補足情報あればコメントにて教えていただけると幸いです。
最後までお読みいただきありがとうございました!!!