あなたが実行したジョブのこと考えてない間、ずっとYARNがジョブのこと考えててくれてたんだ
みなさんはYARNの存在をどれだけ気づいてあげられているだろうか。
- よくSparkと一緒にYARNって単語はよくみるよねー
- 知ってる知ってる、よく図とかでMapReduceとかの下にいるやつだよね?
- クラスタのリソースを管理してるんでしょ、たしか?
いや、間違ってはいないし、やっていることをあたっているんだけど、実はいつも頑張ってくれているYARNのことをもっと理解してあげてもいいじゃないか!
ただ、
- いざ調べてみると日本語の情報が少ない
- なんかざっくりリソース管理を行うぐらいしか書いてない
- もしくはいきなり細かい話から始まってよくわからない
というのがちまたの現状なので、聖なる夜に暇を持て余した私が、いつも頑張ってるYARNのお仕事を紹介しようと思います。
YARNの素晴らしさを熱く語りたいところなのですが、そのせいにかえってYARNとの距離を感じられてしまうと本末転倒です。
なので今回はYARNのお仕事の概要をわかりやすくお伝えできることを目標としてまとめてみました。
ありがとう、YARN
YARNは"Yet-Another-Resource-Negotiator"の略称で、汎用的なクラスタリソース管理フレームワークです。
YARNは従来からあるようなMapReduceといったバッチ処理、はたまたストリーミングのようなオンメモリでの処理をメインとしたような処理など、様々なワークロードに応じた分散アプリケーションをHadoopクラスタ(HDFS)上で動作させることができます。
わたしたち3人でYARNなんだものね
YARNを構成する主要要素と主な役割はこんな感じです。
- ResourceManager
- クラスター全体のリソース管理を行う司令塔
- 常駐プロセス
- NodeManager
- 実際にアプリケーションを実行するワーカー
- 常駐プロセス
- ApplicationMaster
- 上の二つを仲介する存在
- クラスタ上で実行されるアプリケーション毎に起動するプロセス
これらの関係をざくっと表すとこんな感じです。
YARNではクラスターのリソースをコンテナという単位で管理します。
コンテナの中には割り当てるメモリ量、CPUコア数といった情報が含まれています。
実際にアプリケーションがクラスタ上で実行される場合、必要なリソース量分のコンテナが割り当てられることで処理が実行されます。
下記がコンテナのイメージです。
コンテナの存在をふまえて、さっきの図をもうちょっと正確に書くとこんな感じになります。
そうなんすよ。かっけぇーんすよ、YARNは。
YARN上でアプリケーションが実行されて処理が完了するまでの流れをもうちょっと詳しく追ってみます。
以下のようなステップで処理が進んでいきます。(ざっくりしすぎすいません)
- お願いYARN、アプリケーションを実行して!
- 立ち上がれ!ApplicationMaster!
- リソースください!
- いざ、アプリケーション実行!ホウレンソウも大事だよ!
- フィナーレ、アプリケーション終了
実行されるアプリケーションはMapReduceジョブでもいいですし、Sparkアプリケーションでも基本動作は同じです。
- お願いYARN、アプリケーションを実行して!
さて、早速クラスタ上でアプリケーションを実行してみます。
いつも何気なく投入していたアプリケーションをクラスタ上で実行した際に、YARNが何をしているのかをみてみます。
- まずアプリケーションを実行したいクライアントはResourceManagerから、そのクラスター上でアプリケーションを実行してもよいかの認証認可を受けます。
- 認証認可が問題なければ、ResourceManagerから実行しようとしているアプリケーションを識別・管理するための一意なアプリケーションIDがクライアントに対して発行されます。
- クライアントはResourceManagerから発行されたアプリケーションIDとともにアプリケーションの実行依頼を出します。
- 立ち上がれ!ApplicationMaster!
無事クライアントはクラスタ上でアプリケーションの実行ができることになりました。
ただし、まだアプリケーション実行までにはやることがあります。
ResourceManager、NodeManagerは常に常駐しているプロセスなのですが、仲介役のApplicationMasterは実行されるアプリケーション毎に都度立ち上がるのでしたね。
次にやることは、アプリケーションを実行するために必要な登場人物を全員そろえることです。
- ResourceManagerは、ApplicationMasterを起動させるためのノードをNodeManagerが稼動するノードから選択します。
- 選ばれたノードに対して、ApplicationMasterを起動させるために必要なリソース分のコンテナを割り当てます。
- ResourceManagerから割り当てられたコンテナをもとに選ばれたノードはApplicationMasterのプロセスを起動させます。
- リソースください!
今回実行するアプリケーション専任のApplicationMasterも無事起動し、やっとみんながそろいました。
アプリケーション実行まであと一歩です。
次にやることは、アプリケーション実行に必要なリソースをResourceManagerにおねだりすることです。
ただその前に、新米ApplicationMasterは無事起動できたことも含めてResourceManagerにご挨拶が必要です。
- ApplicationMasterはResourceManagerに対して、改めて自分はここにいるよーと伝えて自分の情報を登録してもらいます。その際に、実行するアプリケーション情報をトレースするためのURL情報も一緒にResourceManagerに伝えます。
- 1.の情報を受け取ったResourceManagerは、ちゃんと受け取ったよのお返事をApplicationMasterに返してあげます。
- 無事受け入れてもらえたApplicationMasterは、次に実行するアプリケーションに必要なリソース分のコンテナをResourceManagerにおねだりします。
- おねだりを受けたResourceManagerは、それ応じてコンテナをApplicationMasterに対して割り当ててあげます。
- いざ、アプリケーション実行!ホウレンソウも大事だよ!
必要なリソースも割り当てられて、いよいよアプリケーション実行の時です!
いよいよNodeManagerの本格的な出番の時です。
そして人間界のお仕事と一緒で、処理が始まったらちゃんとホウレンソウをしなくちゃいけません。
- ApplicationMasterは割り当ててもらったコンテナを、今度はNodeManagerが稼動するノードに対して割り当てます。
- リソースを割り当てられたNodeManagerたちはせっせと頑張ってアプリケーションを実行します。
- 処理中もApplicationMasterは、NodeManagerに実行中のアプリケーションの処理状況を確認し、NodeManagerはそれに応じて状況を逐次伝えます。
- 一方で、ResourceManagerもApplicationMasterが元気にやっているのかを確認し、ApplicationMasterから追加のコンテナ要求がきたらそれに応じたりしています。
- フィナーレ、アプリケーション終了
そしてアプリケーションが無事完了しました。
ApplicationMasterのお仕事もこれにて終了で、さよならの時です。
- アプリケーション処理が完了すると、ApplicationMasterはResourceManagerに対して、アプリケーションの実行結果と一緒に、自分のお仕事は終わったよーと伝えます。
- そして役目を終えたApplicationMasterはもらったコンテナを開放し、自身のプロセスを終了します。(お疲れさま!)
- 実行結果を受け取ったResourceManagerは、クライアントにその結果を伝えます。これにてアプリケーション実行は無事完了です!
願い、叶えてくれてありがとな。大好きだ、YARN
何気なく実行していたジョブの裏で、実はこんなにYARNが頑張ってくれていたんですね。
これからジョブを実行する時は、「YARN、みーつけた!」って感じで存在に気づいてあげてください。