1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

プライベートサブネットで起動するEMRクラスターが異常終了したときの解決方法

Posted at

本記事を閲覧いただき、ありがとうございます。
駆け出しクラウドエンジニアの青木です。
今回は私がEMRクラスターの異常終了時に解決した方法についてです。

参考サイト(公式):
https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-vpc-host-job-flows.html

エラーの内容

プライベートサブネットに起動する6つのEMRクラスターの起動を試みたところ、4つが「INTERNAL_ERROR (内部エラー)」、2つが「BOOTSTRAP_FAILURE(ブートストラップエラー)」表示となり、6つすべてのEMRクラスターが異常終了となってしまいました。

おそらくネットワーク周りのエラーではあるのだろうと思ったのですが、具体的にどこが悪いのか見当がつかなかったためサポートに問い合わせを行いました。

実行条件

(エラーの解消とは関係がない部分ですが、一応掲載)
今回、私の動作環境ではEMRクラスターはDataPipelineから呼び出しを行っていました。

具体的な流れとしては、
DataPipelineにて「EmrActivity」オブジェクトを実行 →「EmrCluster」オブジェクトのEMRを起動
以上です。

エラーの解消方法

EMRが起動するサブネットのVPCに設定したDHCPオプションセットの設定が誤っていました。

詳しくは、
① 動作しているリージョンが「US East (N. Virginia)」であれば、DHCPオプションセット内「domain name」を「ec2.internal」に設定する。
  それ以外のリージョンであれば、「domain name」を「use リージョン名.compute.internal」(例: use us-west-2.compute.internal)
② DHCPオプションセット内「domain-name-servers」を「AmazonProvidedDNS」に設定する。

私は以上で解決しました。

また、プライベートサブネットで起動するための要件である、S3へのアクセス経路についても、VPCエンドポイントの設定に問題があるとエラーとなるようです。
参考サイト(公式):
https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-clusters-in-a-vpc.html#emr-vpc-private-subnet

最後までお読みいただき、ありがとうございました!

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?