10
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

NTTテクノクロスAdvent Calendar 2024

Day 1

Systems Manager Automation Runbook 作成の勘所

Last updated at Posted at 2024-11-30

はじめに

こんにちは、NTTテクノクロスでAWSの開発エンジニアをやらせていただいています。だはです。
元教員として、初心者目線から色々な記事を書かせていただいています。
AWSを利用した開発エンジニアとして働き始めて1年、そろそろ技術記事に挑戦してみようと思ったこの頃です。
ちなみに今回はNTTテクノクロスアドベントカレンダーシリーズ2の1日目となります。
業務的にはIaC (Infrastructure as Code)に近い技術を触ることが多いので、細かなサービスごとの差異に着目してみたり、便利な使い方をメモに残してみたりしようと思っています。
第一弾は「(CloudFormationを使い慣れてきた人から見た) Systems Manager Automation Runbookテンプレート作成の勘所」を書いてみようと思います。
内容としては、先日JAWS-UG東京で発表させていただいたものと同じになります。
音声の方が情報入るという方は、是非上記リンクもご覧ください。

目次

1.概要
2.ハマりどころや推せるポイント
 2-1.構文
 2-2.咄嗟に必要になる正規表現
 2-3.実行結果の確認方法
 2-4.処理の途中で型変換
 2-5.二種類の書き方
 2-6.たまに出る謎のエラー
3.まとめ
4.あとがき

1.概要

ここでお伝えしたいのは、大きく分けて3点です。

どんなサービスなのか

まず今回の主題であるサービスをご紹介します。
AWSには"Systems Manager"というサービスがあります。「(仮想、実在、問わず)EC2を通してなんやかんやする」というもの、だと私は解釈しています。
その中の"Automation"というサービスについて、"Runbook"というサービスを通じて、一定の動作をするように定義することができます。
興味のある方は公式のリファレンスを閲覧することで、Runbookでどんなことができるかは確認できるかと思います。

どんなことをしてきたのか

私は上記のサービスを使って、社内AWS利用手続きの簡素化に取り組みました。
例えばEC2インスタンスを作りたい人がいたとしたら、
① Excelシートでパラメータ決めてもらって
image.png
② 関数組んでURLを生成して
image.png
③ URL先にジャンプしたら"Execute"をクリックするだけ
image.png
...と、いったことに取り組んだ結果、色々学ぶことができました。

どんな話をしたいのか

次に本記事の概要です。「はじめに」でもご紹介したように、今回は「(CloudFormationを使い慣れてきた人から見た)Systems Manager Automation Runbookテンプレート作成の勘所」を書いていきます。
以下、"CloudFormation"は"Cfn"と、"Systems Manager Automation Runbook"は"Runbook"と表現していきます。ご留意ください。
目次で大まかな内容は想像がつくかと思いますが、実際にRunbookテンプレートを作成していくにあたって「ここは苦戦したから残しておきたいな」「こう使うと便利だな」と感じた部分を書きました。
細かい型定義の差異やコード記述方法の使い分けなど、Runbookを触っている方向けの記事になっていると思っています。

(目次へ)

2.ハマりどころや推せるポイント

2-1.構文

これ地味に効いてくるのですが、他のStepやParametersで受け取っておいた値を引用しようとすると、書き方が特殊すぎてイライラします。
CloudFormationだと何も考えずに宣言した関数(みたいなもの)を書けばいいと思います。
一方で、Runbookは下記のように書く必要があります。
ssm③.png
CloudFormationだと

Cfnコード

Values:
  - SubnetAvailabilityZone

でいいところを、Runbookでは
Runbookコード

Values:
  - '{{ SubnetAvailabilityZone }}'

と、書かされます。該当箇所を空白で囲み、二重中括弧で囲み、シングルクォートで囲む必要があるのです。

更に追い打ちをかけるのが、宣言です。
image.png
上の画像をよく見てほしいのですが、すべて小文字で始まります。
しかし単語の組み合わせが発生しているものに関しては、途中で大文字を挟む必要があります。

まるでボディブローのようにジワジワきます。私の引っかかったエラーは、6割が上記の構文ミスでした。

(目次へ)

2-2.咄嗟に必要になる正規表現

次に個人的な備忘録としても残しておきたいのが、正規表現です。
これは私の経験不足でもあるのですが、Runbookを触ることになって、初めて正規表現を使わされました。
ssm⑤.png
利用タイミングは、各Stepで出力される値を、別のStepで利用したいときが該当します。
Outputを書くことになるのですが、例で"$.Payload.message"とあります。
初心者は「"$"ってなんぞや。Excelの絶対参照か?」となるはずです。私はなりました。
これは正規表現を用いて、各種APIの出力文を抜き出すための場所なようです。
リファレンスでは以下のように、各種APIで出力される文章のサンプルがあります。
スクリーンショット 2024-09-22 17.18.34.png
そのうち必要なものを抜き出すために、正規表現が必要だそうです。大変。
今回はあくせくしながら書きましたが、未だに理解できている実感はありません。恐ろしや。

(目次へ)

2-3.実行結果の確認方法

Runbookの実行において便利でもあり、ちょっと不便でもあるのが、実行結果の確認方法です。
結論から述べると、「Runbookを実行する」項目と「Runbookの実行結果を確認する」項目は別サービスの扱いに見える、ということです。
Runbookを作成して、実行する項目は下記のような画面になります。
スクリーンショット 2024-09-06 21.51.39.png
ちなみにランブックオートメーションを実行すると、下記のような画面に遷移していきます。
スクリーンショット 2024-09-06 18.50.42.png
当然ですが、Runbookの実行直後は結果を追いかけることができます。
一方で、少し間を置いて(他サービスを閲覧するなどして)実行結果を確認したい場合、上記のサービス項目から探すことはできません。
個人的には、RunbookはAutomationサービスの動きを定義してあげているに過ぎないので、下記のような画面を遷移する必要がある、という解釈です。
スクリーンショット 2024-09-06 18.54.12.png
最初は戸惑いがありましたが、Cfnとは違って結果だけをシンプルに確認していけるので、これはこれでありかな、という感想です。

(目次へ)

2-4.処理の途中で型変換

Runbookテンプレート作成で最も長い間躓いていたのは、ParametersのList化です。
AWSのIaCはCloudFormationテンプレートの作成から入ったので、Runbookの習熟には少し混乱が生じました。
私が混乱した差異を列挙すると

  • Cfnでは整数型を"Number"で表現するのに対して、Runbookでは"Integer"と表現すること
  • 文字列型のList化は可能だが、他の型のList化は不可能であること
  • Runbookテンプレート内にちょっとした条件文やPythonコード実行処理を挟むことで、やりたいことは大体実現できること
  • 他サービスとの連携を、API単位で記述すること(リソースの作成削除、とは考え方が違うこと)

...と、いう点でした。
さて、Cfnテンプレート作成の際は、時折「EC2インスタンスを自動的に止める時間」や「CloudWatchの閾値」をParameter化することがあったのではないでしょうか。
またはブール値のパラメータをユーザーに選択させたい、ということは無いでしょうか。
私はそんな時、ユーザビリティを考慮してList化することが多いです(クリックで選択でき、謎のスペルミスでエラーが起きることを回避するため)。
image.png
これを
image.png
こうしたいわけです。
image.png
が、Runbookでは整数型やブール型をList化できない、という欠点があります。
image.png
こう書いても
image.png
こうなります。悲しい。
そこで取り組んだのが、
① 一旦文字列型でList化し、ユーザーにParameter入力してもらう
② executeScriptのstepを設けて、Pythonコードで型を変換する
③ outputしてじっくり料理する
と、いう方策です。
該当部分のコードを書いてみると、以下のような内容になります。

今回のコードはだいぶ前に書いたものでして、EOLとされているPython3.8です。
利用する際はPython3.11での動作を確認することを推奨します。
ご留意ください。

今回のコード(クリックで展開)

schemaVersion: "0.3"

description: |-
  test
  test2

parameters:
  TimeForAutoStopInstance:
    type: String
    default: true
    allowedValues:
      - 1
      - 2

mainSteps:
    - name: ConvertStringToInteger
    action: aws:executeScript
    nextStep: Hogehoge
    isEnd: false
    inputs:
      Runtime: python3.8
      Handler: script_handler
      Script: |-
        def script_handler(events, context):
          test_str = events["StrParameters"]
          test_int = str(test_str)
          return{"test_int": test_int}
      InputPayload:
        StrParameters: "{{ TimeForAutoStopInstance }}"
    outputs:
      - Type: Integer
        Name: Autostop
        Selector: $.Payload.test_int

細かく解説していくと、

Parametersの項目では、List化した値をユーザーに選んでもらう

parameters:
  TimeForAutoStopInstance:
    type: String
    default: true
    allowedValues:
      - 1
      - 2

"executeScript"のStepを作り、Pythonコードにて型変換させてあげる

    - name: ConvertStringToInteger
    action: aws:executeScript
    nextStep: Hogehoge
    isEnd: false
    inputs:
      Runtime: python3.8
      Handler: script_handler
      Script: |-
        def script_handler(events, context):
          test_str = events["StrParameters"]
          test_int = str(test_str)
          return{"test_int": test_int}
      InputPayload:
        StrParameters: "{{ TimeForAutoStopInstance }}"

型変換したStepで新たにOutputし、後で好きなように料理する

    outputs:
      - Type: Integer
        Name: Autostop
        Selector: $.Payload.test_str

以上の段階を踏むことで、ユーザビリティ向上や、Parameterの設定ミスというリスク回避をすることができました。

(目次へ)

2-5.二種類の書き方

Runbook作成の際に最も感動したのは、パズルを組み合わせるだけでコードを書ける(書いてくれる)、ということです。
ここ一番の感動ポイントです。大事なことなのでもう一度言います(書きます)。
可視化しながらコードを書ける」んです。

「コード」モード

例えばEC2インスタンスを立ち上げさせたい時、"EC2:LaunchInstance"というAPIを処理させると思います。
YAMLコードで書いていくと、下記の要領でリファレンスなどを調べながら記述することになるでしょう。
スクリーンショット 2024-09-06 22.07.37.png
これはこれで普通にコード書けます。当然、ローカルにとっておいた過去の成果物をコピペしたり逆も然りで自由です。

エラー検知もしてくれます。たまに変なところを指すのは最早可愛げすらあります。

真ん中の上の方に「レコメンデーション」とありますが、「こうした方がいいよ」というのをこっそり教えてくれたりもします。

「デザイン」モード

上記に加えて、Step単位でドラッグ&ドロップしていくことで、Runbookを作成していくこともできるのです。
スクリーンショット 2024-09-06 22.07.58.png
この「デザイン」機能ですが、既に多くのテンプレートを書いている方は「コード」機能にコピペで済むので、メリットは少ないかもしれません。
ちなみにちょっと不満なのは、なんだかんだで細かいパラメータの設定は、手書きなところ。例としてはこんな感じです。先ほどと同じ画像を使っています。
ssm③.png
ただ繰り返しますが、「デザイン」機能は個人的には書き終わったものに対しても、処理の流れや分岐を視覚化できるので、とても助かる機能ではあります。
あと今振り返って思えば、AWSのAPI一覧をアイコンで眺めていられるのも楽しかったです。
image.png
小学生の頃、国語辞典や生物図鑑を眺めていたような気持ちになれます。

(目次へ)

2-6.たまに出る謎のエラー

おそらくこれは本件に限った話では無いですが、明らかに正しい箇所に赤い波線が生じていることがあります。
カーソルを合わせてみても、見当違いのことを言われることもしばしば。
普段APIを叩くとやけに細かいエラー文が確認できる分、こういうところで戸惑う人がいるかもしれませんね。ちなみに私は戸惑います。
image.png
細かいユースケース1つ1つに対応するのは難しいですが、こういう時は大体全然関係ないところが書き足りなかったり、スペルミスだったりします。
結論としては、「赤波線は素直に信用しない」というところでしょうか。

(目次へ)

3.まとめ

  • 作るとき
    そもそもこの記事の主題は「CloudFormationを書き慣れてきた人がRunbookを書くとどう感じるか」というものでした。この視点で考えると、細かな構文の差異だったり、エラーの示し方だったりで戸惑うんじゃないかな、と思っています。(エディタ用意してもらってる身で言うのもおこがましいとは思いますが。)
    逆に、GUIチックにコードを操作できる場面も存在するので、そこは美味しい点だけ活かして使っていければ良いんじゃないかな、とは思っています。知らないAPIを眺めていられるというのも、初心者には嬉しいポイントです。

  • 使うとき
    APIに様々な処理を組み合わせて使うことができます。
    ループや条件分岐、スリープは本記事に書いた通りです。
    またこれも書いた通りですが、途中で小規模なpythonコードを動作させることもできます。
    パラメータ入力には工夫の余地があるかと思います。Excelなんかと組み合わせることで、エンドユーザーがAWSを使いやすくする、なんてのは良い例になるかと考えています。

今後も諦めずに触って、より良い使い方を見つけていきたいところです。

4.あとがき

今回は初心者目線でRunbookの使い易さ使い辛さを残していくことで、技術的なノウハウを残す記事を書いてみました。これからRunbookを触る方の一助になれば幸いです。

以上NTTテクノクロスアドベントカレンダーの1日目、だはがお送りしました。
弊社に興味を持っていただけた方は、こちらをご覧ください。
明日は@kn-tomさんの記事「pg_repack を使ったデータベース再編成運用の注意点」になります。どうぞお楽しみに!Merry Christmas!

10
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?