0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

AWS Glue serverless Spark UI observability metricsを試してみた

Posted at

背景・目的

先日、Announcing AWS Glue serverless Spark UI and observability metricsが、発表されました。

これにより、GlueでSparkUIで確認できるようになりました。
個人的には、待望の機能だったのでとても嬉しく、早速試してみました。

まとめ

  • Spark UIがGlueに組み込まれました。
  • CloudWatchメトリクスで詳細なメトリクスが確認できるようになりました。

実践

前提

データを用意

  1. Redshiftのドキュメントに添付されているサンプルのデータセットtickitdb.zipをダウンロードします。

  2. いくつかのファイルのうち、最も大きいサイズのlisting_pipe.txtを使用します。

    $ head listings_pipe.txt 
    1|36861|7872|1850|10|182.00|1820.00|2008-01-24 06:43:29
    2|16002|4806|1890|7|233.00|1631.00|2008-03-05 12:25:29
    3|21461|4256|2131|2|182.00|364.00|2008-11-01 07:35:33
    4|8117|4337|1970|8|38.00|304.00|2008-05-24 01:18:37
    5|1616|8647|1963|4|175.00|700.00|2008-05-17 02:29:11
    6|47402|8240|2053|18|77.00|1386.00|2008-08-15 02:08:13
    7|36551|7801|2145|5|30.00|150.00|2008-11-15 09:38:15
    8|11891|8036|2139|6|82.00|492.00|2008-11-09 05:07:30
    9|691|554|2078|6|135.00|810.00|2008-09-09 08:03:36
    10|24858|3375|1994|16|197.00|3152.00|2008-06-17 09:44:54
    $
    
  3. S3にアップロードします。
    image.png

Spark UI とObservability metricsの確認

ジョブの作成

  1. 下記のジョブを作成します。

  2. 「Job details」をクリックします。

  3. 「Spark UI」と「Job observability metrics」を選択します。(デフォルトでチェック入っています。)
    image.png

  4. 最後に「Save」をクリックします。

ジョブの実行

  1. 「Run」をクリックし、ジョブを実行します。
  2. Succeededしました。
    image.png

Spark UIの確認

  1. 「Spark UI」タブをクリックします。おおぉ、見えました!
    image.png

  2. 「Stages」タブをクリックします。Inputで11.58MBです。たしかにデータ量と一致しています。
    image.png

  3. 「Executors」タブをクリックします。DriverとExecutorsが1つずつ動いていることがわかります。
    image.png

Observability metricsの確認

  1. CloudWatchのトップページに移動します。

  2. ナビゲーションペインで「すべてのメトリクス」をクリックします。

  3. 「Glue」をクリックします。

  4. オブサーバビリティメトリクスをクリックします。

  5. 任意のメトリクス、ジョブ名を選択します。

  6. グラフ化したメトリクスを選択し、統計、期間などを選択します。確認できました。

    image.png

考察

今回、リリースされたSpark UIとObservability metricsを触ってみました。Observability metricsについてはGlueのメトリクスよりも深く見れるので、とてもよいですね。これがGlueのUIで見れると嬉しいです。
また、SparkUIは、今までは、別途DockerコンテナやEC2などで環境を構築しなければならかったのですが、EMRと同様にUIに組み込まれて生産性が爆上がりです。とても嬉しいです。

参考

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?