AUG Tokyoとは
Atlassianのユーザーによるコミュニティ
- ツールの使い方をとことん共有し、利用者全体の日々の作業効率をあげる
- ツール管理者の孤独な戦いの脱却
- 先人の知恵の共有
- AtlassianはもちろんDevOps、チームビルディングなどの発信の場の提供
イベントページ
全体通しての感想
- Atlassian皆川さんのお話より
- OpsGenieの登場で、Atlassianはビジネス-開発-運用の全てをインテグレーションできるツール群が揃ったのだ、という印象を受けました
- IT運用も「チーム」「アジャイル」「価値の提供にフォーカス」という視点を持つことが重要、という話が印象的でした。私の勝手な印象では、IT運用はプロセス重視の色が強いと思っているのでギャップがありました。
- リックソフト福田さんのお話
- OpsGenieの使い方と設定方法が、具体的な説明でとても分かりやすかったです
- 特に、Androidだとマナーモードを突破して通知が来る、ってのが驚き!
- Graats Saitoさんのお話
- 私は、アジャイルコーチはやりがいがありそうだと感じました。
- Saitoさんの熱量を感じました。
- 懇親会
- 懇親会の場は、AUGの非常に価値ある時間だと感じました
- 解散となっても話が尽きずなかなか人が帰らない、ってアツいですね!
セッション毎のメモ
Session1
アトラシアン流インシデント管理 チーム中心のITSM
by Takahiro Minagawa @atlassian
講演資料
私の感想・心に残ったこと
・日常の仕事を改善することは、日常の仕事をすることよりも重要だ
・インシデント管理のなかでの「学び+改善」を大事にする
・Atlassian Incident Handbook
https://www.atlassian.com/incident-management/handbook
IT運用あるある
運用マスター
→運用を見える化
→誰でもできるように手順化
→誰でもできるからツマラナイ・・・
バラバラの個々人が仕事をする
→チームとして
→タスクをみんながこなせるように
→誰でもできるからツマラナイ
大切なこと
「日常の仕事を改善することは、日常の仕事をすることよりも重要だ」
ITSMとアジャイル
DX時代。スピードが求められる
ITSMもアジャイルと融合していくんだ
チームの原則
・パフォーマンス
・文化
・プラクティス
パフォーマンス
IT運用では…何を価値と置く?
リクエストを数多くさばくこと??
それだけではないはず。
→リクエストがなくても良いような状態とか
リクエストは早くさばいて、本当に必要な、価値のある仕事を行う
文化
Atlassian Team Play Book
Agile FOR IT TEAMS
プラクティス
・デリバリ
・運用
・サービス
運用
>インシデント
問題管理
変更管理
インシデントと問題管理を分けて考える。
Ex)鼻血が出た
→インシデント:鼻血を止める
→問題管理:鼻血の原因を対処する
インシデント管理での物事の流れ
重大な障害が起こってから、どのような順序で物事が進んでいくか
「検知+伝達・通知 > 応答+調査 > 解決+復帰 > 学び+改善」
MTTRのうち、70%が「応答と調査」にかかっている (フォレスターの調査より)
→適切な人に早く伝えられることが、この時間を縮めるのに効果を発揮するのではないか。
Atlassianが大切に考えるのは、「学び+改善」
チームのためのインシデントプレイブック
https://www.atlassian.com/incident-management/handbook
Atlassian for IT
チーム中心
→OpsGinieは、チーム中心のツールになっている
顧客中心
アジャイル&DevOpsを内包している
信頼とコラボレーション
Session2
Opsgenie 運用事例 by Osami Fukuda @RickSoft
講演資料
〜あとで載せる〜
メッセージ
・Opsgenie利用の具体的なイメージを持ってもらいたい
・今日の話は基本的な機能。導入すると最初に通る道
OpsGenieとは?
様々な監視ツールからの情報を集めて、アラートの方法をカスタマイズできる
Good Point
★UI/UXがシンプルで設定がかんたん
★モバイルアプリが使いやすい
→マナーモードにしていても強制的に解除して音を出すこともできるらしい
・電話通知がある
・細かい通知設定が可能
(★:特にGood)
もっとこうだといいな
・Opsgenie自体の障害が減る
・ハートビート機能の安定
・日本語でのサポート
→英語ドキュメントはしっかりしている。チャットでのサポートも充実している。
課題と解決事例
導入前にかかえていた課題
- 夜間・休日対応担当者の偏り
- 不要な通知がたくさんある
- 夜間のアラートに気づかない
- 通知方法が限られている
- 障害時の担当者があいまい
①夜間・休日対応担当者の偏り
→オンコールスケジュールを設定できる
ローテーション機能!
人のローテーションサイクルの間隔、期間、時間帯が設定できる
→エスカレーションポリシーを設定できる
まずは主担当。
10分後にももう一度主担当
20分後には主担当+副担当
30分後も同様。
40分後には、関係者全員に
→ルーティングルールの設定
タグをアラートにつけられる
タグ+時間帯・曜日などの条件で、アラートの通知先を変えることができる
②不要な通知がたくさんある
→インテグレーション
200ほどのツールとインテグレーションできる
今回はZabixとのインテグレーションを事例紹介
・ZabixからOpsgenieにアラートが来たときの動きを設定できる
→Ignoreの設定で、通知を止められる
→CreateAlertの設定。条件に応じて、プライオリティやタグをつけてアラートを作れる
→ルーティングルール
タグによって、不要な通知を止める
Ex)WARNレベルのもので深夜に起こったものは、通知をオフ
③夜間のアラートに気づかない、通知方法が限られている、障害時の担当者があいまい
→Notifications
ユーザごとに通知方法を設定できる
>メール、SMS、電話、モバイルアプリ
→Notification rules
アラート発生時とか、スケジュール開始時、などのトリガーで通知を飛ばせる
例えば…
・業務時間中 > モバイルアプリ
・業務時間外 > モバイルアプリ+社用携帯+個人携帯
ミュートの設定などもできる
→Alert Status
3種類。Open > Ack'ed > Close
Ack'ed:誰かが認知したよ、という状態
使い方
slackに通知が来るようにしている
Ack'edになったことを、slackのチャンネルに流すことができる。誰がとったかわかる。
経緯の確認などもできるようになった
まとめ
・現在最低限の機能利用だが、当初あった監視における課題はそれなりに解決された
・Opsgenieの初期設定時間 << 本発表の準備時間
QAコーナー
・日本の祝日には対応しているのか?
→対応していません。オーバーライドという機能で、設定することができる
・日本の電話は非対応という話もきいたが?
→評価版などの影響もあるかも。プロフェッショナルレベルだと
・AWS障害に活躍したのか?
→Zabixだけだと、アラートがなり続ける
Opsgenieの場合、エイリアスという、同じアラートがあった場合、一度しか鳴らないような設定ができる。
今回は、1回のアラートのみであった。
Session3
Agile Coache's Struggle Journy
アジャイルコーチになって3ヶ月で学んだこと
by Norihiko Saito @Graats
講演資料
メッセージ
アジャイルコーチ・コンサルタントのイメージ
やってみる前の印象 クライアントの代わりに問題解決をする人
やってみた今の理解 クライアントが問題解決するのを手助けする人
<コンサルタントの秘密>
依頼主は問題の解決方法がわかっている
会話の中の最初の5分の中に答えがある
どうやって手助けにおけるアドバイスって?どうなの?
アドバイスは、危険な場合もある。
Why?
クライアントの問題解決能力の向上につながらない
言われたからやるマインド。持続しづらい。
ADKARモデル(変革マネジメントモデル)
5つの段階がある
自分で変わらないといけない!と意識しない中で、知識などを与えても効果が出ない
https://ataway-cm.jp/adkar/
アドバイスが有効なときもある
初期とか。
どうやって手助けする?
・気づかせる
・考えさせる
・やる気にさせる
どうやってやるの?
→相手を信頼して、ゆだねる
→アドバイスよりも、質問と沈黙
アジャイルコーチ楽しい?
自分自身を手助けできなければ、他人を手助けできるはずがない
3ヶ月やってみて、楽しい