More than 5 years have passed since last update.

HadoopYarnクラスター環境構築メモ

Last updated at 2019-02-11Posted at 2019-01-27

HadoopYarnクラスターの環境を構築する時には、色々な疑問点が遭ってしまいましたが、次に間違えなくなる為に、環境構築時の要注意ポイントをメモしてみたいです。

環境変数

HadoopYarnクラスターで以下の環境変数が必要となります。

HDFSのnamenodeをフォマットします。

$ hdfs namenode -format

　HDFSサービスを起動します。

$ start-dfs.sh

　jpsコマンドでHDFSクラスターに以下のノードが起動されていたかどうかを確認する

http：//master:50070

　　以下でyarnを起動する

$　start-yarn.sh

　　jpsコマンドでyarnの稼動状態を確認します。
　　以下のノードが確認できます。

ブラウザも確認できます

　　http：//master:8088

Sparkのspark_env.shに設定する変数は以下です
　SPARK_MASTER_HOST=マスターのホスト名
　SPARK_MASTER_PORT＝7077

Sparkのslaveに設定する変数は以下です
　Masterのホスト名又はIP
　Slaveのホスト名又はIP

　以下でSparkを起動する

$　　start-all.sh

jpsコマンドでSparkの稼動状態が確認できます

ブラウザも確認できます

http：//master:8088