LoginSignup
1
0

More than 1 year has passed since last update.

Databricksジョブでマトリクスビューとジョブの修復がサポートされました

Posted at

Databricksジョブでジョブに含まれるタスクの処理時間・ステータスを俯瞰できるマトリクスビューと、失敗したタスクのみを再実行できる修復(リペア)機能がサポートされました。間も無く日本リージョンでも利用できるようになります。

マトリクスビュー

これまでは一覧でしかジョブの実行結果を確認することができませんでしたが、対象のジョブ詳細画面の右上に表示されるトグルスイッチでマトリックスを選択することで、マトリクスビューに切り替えることができます。
Screen Shot 2022-04-25 at 7.28.24.png
ジョブ全体の所要時間、タスクごとのステータスをマトリクス上で確認することができます。
Screen Shot 2022-04-25 at 7.29.46.png

  • Job Runsの行の棒グラフはジョブの実行時間に応じた長さで表示されます。
  • セルの色はジョブ、タスクのステータスに対応します。成功は緑、失敗は赤、スキップされたタスクはピンクになります。
  • それぞれのセルの上にマウスカーソルを移動すると、詳細を確認することができます。
    Screen Shot 2022-04-25 at 7.31.51.png
    Screen Shot 2022-04-25 at 7.32.04.png

ジョブのリペア

Databricksジョブはマルチタスクジョブであり、複数のタスクからジョブを構成することができます。ただ、これまでは、途中のタスクで処理が失敗しても、そこから再開することができませんでした。このリペア機能を活用することで、失敗したタスクからジョブを再開することができます。

  1. まず、意図的にタスクでエラーが起きるようにしてみます。
    Screen Shot 2022-04-25 at 7.49.46.png

    こちらのfilter-baby-namesタスクのノートブックの最後の行のdisplaydisplay1に変更します。これでジョブを実行すると、2つ目のタスクがエラーとなります。
    Screen Shot 2022-04-25 at 7.45.25.png

  2. 失敗したジョブの詳細画面に移動すると右上に修復ジョブの実行ボタンが表示されます。
    Screen Shot 2022-04-25 at 7.45.53.png

    このボタンを押すと失敗したタスクから処理を再試行します。このボタンを押す前に上で明示的に混入させていたエラーを直します。

  3. 修復ジョブの実行ボタンを押すと、パラメーターを指定するためのダイアログが表示されます。ジョブのパラメーターを変更する場合にはここで指定します。
    Screen Shot 2022-04-25 at 7.46.12.png

  4. 修復ジョブの実行ボタンを押すと、失敗したタスクから処理が再開します。
    Screen Shot 2022-04-25 at 7.46.27.png

この機能を活用することで、大規模なジョブが失敗した場合でも全ての処理をやり直す必要がなくなります。

Databricksジョブのマニュアル

Databricksジョブのマニュアルはこちらを参照ください。

本記事で紹介した新機能の説明はこちらとなります。

Databricks 無料トライアル

Databricks 無料トライアル

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0