はじめに
この記事はisucon本の8章の内容をまとめたものになります。
この書籍では高速化について主に以下の観点でまとめられています
- 負荷試験
- モニタリング
- DB
- キャッシュ
- リバースプロキシ
- OS
この記事ではそれ以外に該当する高速化のテクニックについて紹介します。一部上記の内容に該当するものもありますが、書籍に準拠してこの記事に記載しています。
外部コマンド実行ではなく、ライブラリを利用する
外部コマンドを実行すると、アプリケーションとは別のプロセスを起動する必要があります。別のプロセスを起動するコストがかかり、起動したプロセスがメモリを消費するため、メモリの消費量も増えてしまうのでなるべくライブラリなどの代替手段を用意しましょう。
開発用の設定で冗長なログを出力しない
冗長なログも動作を遅くする原因になってしまいます。例えば一回のリクエストのログ記述に5KB必要なログと10KB必要なログがあるとします。通常はそこまで気にならないかもしれません。しかし開発用環境で負荷試験をする際にはリクエストが増大すればするほど必要なメモリ量の差も倍増し、正確なモニタリングが難しくなるので気をつけましょう。
CDN上にHTTPレスポンスをキャッシュする
CDN(Content Delivery Network) とはCDN業者によって張り巡らされた高速なネットワークのことです。
世界中に一斉にコンテンツを配信したい際に、ユーザーの最寄りのサーバーからそれぞれコンテンツを配信することによって世界中のユーザーに高速にコンテンツを届けることができます。
そんなCDNには以下のような機能があります。
- 柔軟なキャッシュ設定
- エッジサーバーでキャッシュをすれば高速にレスポンスをクライアントに返せる
- アクセスログなどのログ保存
- HTTPのリクエスト・レスポンスの書き換え
- DDoS対策
- 大量のリクエストやトラフィックをWebサービスに送ることでWebサービスを提供できなくする攻撃を防ぐ
- Web Application Firewall
- 攻撃と思われる悪意のあるリクエストを遮断したり、ログを取得する機能
~書籍より引用~
様々な機能がありますが、ここではキャッシュについて説明します。httpのCache-Controlヘッダーを用いることでProxyやCDNなど経路上のキャッシュに関する設定をすることができます。 CDNではクライアントから近いCDNのエッジサーバーからレスポンスを直接返すことができます。アプリケーションサーバーのリクエストを減らすことによって負荷を減らすことも可能です。
一方でCDNの挙動に対して詳しくなければ事故を起こしやすいです。 キャッシュはそもそも実装を間違えて事故を起こす可能性が高いのですが、CDNそのものの挙動も難しいので事故を起こす可能性はより一層高くなってしまうので注意が必要です。
HTTPクライアントについて
以下のことを確認して導入することがよいと書籍で紹介されています。
同一ホストへのコネクションを使い回す
コネクションの確立にもコストがかかります。コネクションを確立するにはローカルのポートを消費する必要があります。また、TCP、TLSハンドシェイクも必要なのでそれにもコストがかかります。そのため、できる限り同一ホストへの通信はコネクションを使い回すのが理想です。
適切なタイムアウトを設定する
通信は成功する保証はなく、タイムアウトしていしまうことも勿論あります。その間リソースを消費し続けるので適切なタイムアウトを設定することが重要です。
同一ホストに大量のリクエストを送る場合、対象ホストへのコネクション数の制限を確認する
ライブラリやネットワークのシステムによっては外、対象ホストへのコネクション数が制限されていることがあります。同一ホストに大量のリクエストを送る場合、ドキュメントを確認して、制限がどうなっているか確認する必要があります。
まとめ
以上がisucon本8章まとめです。チューニングに必須な項目を要約したので是非ご活用ください!
その他の章の記事はこちらから
ISUCON本の内容をまとめてみた DB編
ISUCON本の内容をまとめてみた リバースプロキシ nginx編
ISUCON本の内容をまとめてみた キャッシュ編
ISUCON本の内容をまとめてみた 高速化に必要なその他技術編
ISUCON本の内容をまとめてみた OS Linux編