プログラミングしかしらない。。。
私は会社で主にサポート対応を担当しています。不具合が見つかったりすると、その原因を特定し、修正をするといった仕事です。
ただ一概に不具合といっても、プログラミングのコードが生み出したバグが原因のときもあれば、Webサーバにアクセスが集中してパフォーマンスが低下することが原因のときもあります。
プログラミングに触れ始めてから2年が経過しましたが、私はプログラミングのことしか勉強してきませんでした。Webアプリケーションがどのように構成されているのか全く知らないがために、不具合の調査するときに原因を特定できないといったことを何度か経験しています。
このままだと効率力よく不具合調査を進められないことを危機に感じ、入門書として「プロになるためのWeb技術入門」という本を手に取りました。
これは何の記事か?
プログラミングしか学んでこなかったエンジニアが「プロになるためのWeb技術入門」を通じて、Webアプリケーションの構成要素についてまとめた記事です。
対象読者
- プログラミングしか学んでこなかった
- Webアプリケーションの全体像について知りたい
この記事のゴール
- Webアプリケーションの構成要素を把握すること
なぜWebアプリケーションの構成を理解するべきなのか
Webアプリケーションを開発する立場の人は、Webアプリケーションを利用する人たちに期待通りのWebページを表示させなければなりません。
そのため、Webアプリケーションの規模によって、サーバサイドのどのノードにどの役割を担わせるかを考えなければなりません。
そうしないとWebサーバにアクセスが集中することでパフォーマンスが低下し、利用者に期待通りのWebページを提供できなくなったり、障害が起きたときにどこに原因があるのか特定が難しくなったりします。
そういった理由から、Webアプリケーションを運用していくには、Webアプリケーションの構成要素を理解しておくべきということです。
Webアプリケーション構成の歴史
結論から言うと現代のWebアプリケーションのほとんどは、Webサーバ・データベースサーバ・アプリケーションサーバの三層構成になっています。
ではなぜ三層構成になったのか。
これはWebアプリケーションの歴史的背景を知ることでより理解が深まります。以下ではWebアプリケーションの歴史をベースに、なぜ三層構成が基本的な構成になったのかを説明をします。
Webサーバだけの構成だった時代
WWWが生まれた当初は、HTMLのみで記述された静的ページだけを表示するサイトがほとんどだったこともあり、多くのシステムはWebサーバだけの構成でした。
その後CGI(Common Gateway Interface)の発明により、Webページを動的に生成できるようになりました。しかし、この段階ではまだひとつのノード上でWebサーバとCGI経由で呼び出されるアプリケーションの2つのプロセスが動作している状態でした。
CGIを利用すると毎回Webサーバとは別のプロセスが同一ノード上で起動するため、効率が悪くなってしまいます。それを改善するために、Webサーバ内でプログラムを直接実行できるようにしました。
データベースサーバの登場
アプリケーションが高度化してきたことで、利用者とのやりとりの情報を蓄積し、効率よく検索できるようなソフトウェアが必要になりました。(紙とボールペンだけで記録したり、記録した紙からデータを抽出することは人間の能力だけでは限界があるからです。)
例えば、ECサイトを運用するにあたり、どういった人はどういったものを購入するのか、そういったデータを蓄積して、それらを分析すれば、もっと利益をあげることだってできるわけです。
そういった背景から、大量の情報を蓄積することができるデータベースが登場し、それの実現と取り扱いに特化した**データベース管理システム(DBMS:Database Menagement System)**も登場しました。
WebアプリケーションからDBライブラリを通じて、データベースにクエリを送ることで、データを記録したり、検索したりすることができます。
データベースサーバの登場により、Webアプリケーションの構成が以下のように変化しました。
データベースサーバを別ノードで稼働させるようにすることで、情報の記録や検索処理を分離しています。これにより、データベースが大きくなって、情報の記録や検索処理を実行しても、WebサーバのCPUに負荷をかけないような構成になっています。
アプリケーションサーバの登場
CGI経由で動的コンテンツを生成すると、Webサーバへリクエストが届くたびにプロセスが起動するため、時間がかかるといった性能面の問題と、当時使用されていたPerl
は現状の制約から大規模システムの開発に向かないという問題がありました。
それらの問題を解決するひとつの方法として広まったのが、Java
でした。では、Java
プログラムがWebアプリケーションの中でどのように実行されているかを説明します。
※ WebサーバがApache
で、APサーバがTomcat
が使われているWebアプリケーションを例としています。
Java
プログラムは、Webサーバのノード上に存在するJavaVM
と呼ばれる仮想的なコンピュータが実行をしています。(Webサーバとは別プロセスで実行されています)
JavaVM
上では**アプリケーションサーバ(Application Server)**と呼ばれるソフトウェアが常駐しており、それがJava
プログラムを実行するという構造になっています。
Webサーバとアプリケーションサーバはどのように連携しているかというと、特に標準的な方法が決まっているわけではありません。ここではApache
とTomcat
の組み合わせを例に説明がされています。
Webサーバとアプリケーションサーバは異なるプロセスであるため、連携するには何らかの通信を行う必要があります。それを実現する方法として一般的なのは、アプリケーションサーバ側によって作成された連携用モジュールをWebサーバに組み込むという方法です。
今回の例では、Tomcat
がApache
向けに提供しているmod_jk
と呼ばれるモジュールをApache
に組み込むことで連携を実現しています。
こうすることで、HTTPリクエストをWebサーバが窓口となって受け取り、動的処理が必要な場合はアプリケーションサーバに処理をお願いするといった役割分担がなされます。
またデータベースサーバのように、アプリケーションサーバを別ノードで動かすことも可能です。
一般的なWebアプリケーションの構成
Webアプリケーションの構成にはいろいろなパターンがありますが、その中でも一般的な構成が、Webサーバとアプリケーションサーバとデータベースサーバをそれぞれ別のノード上に配置する構成です。
こうすることで、それぞれのコンピュータのもつリソースを各サーバの役割へ最大限振り分けることができます。
まとめ
WebアプリケーションはWebサーバとデータベースサーバとアプリケーションサーバの三層構成になっている。
- Webサーバ
- HTTPリクエストの一次窓口
- 静的ページがリクエストされたときはそのままHTTPレスポンスを返す
- 動的処理が必要なページがリクエストされたときは、アプリケーションに処理を依頼し、生成されたHTMLをHTTPレスポンスとして返す
- データベースサーバ
- 利用者とのやりとりで必要な情報をデータとして記録する
- データベースから特定のデータを検索・抽出する
- アプリケーションから送られるクエリによって上記の操作ができる
- アプリケーションサーバ
- Webサーバから動的処理を依頼されるサーバ
- データベースサーバとクエリを通じてやりとりを行うサーバ
参考にした本
「プロになるためのWeb技術入門」 ――なぜ、あなたはWebシステムを開発できないのか
所感
今までプログラミングしか学んでこなかったので、Webアプリケーションがどのように構成されているか全くわかっていませんでした。これがわかっていないと、何か障害が起きた時にどこに原因があるか調査する時に、アプリケーションサーバ以外のWebサーバやデータベースサーバが候補にすら上がらないことになると実感しました。
またアプリケーションサーバの負担が多くなってきたら、HTTPリクエストに含まれるURLのよって、動的処理を任せるアプリケーションサーバを分ける方法もあることを知り、Webアプリケーションのインフラ周りの楽しさが垣間見えた気がします。
これをきっかけにAWSなどについても学びを広げていきたいと思います。