イベントはこれ
JAWS-UG金沢 #36 x OpsJAWS! AWS運用・監視についてのクロスイベント!と称して金沢で開催しました!
DMMGAMESさんのとってもおしゃれな会場をお借りしての開催。3連休初日にも関わらず20名もくらいの方が集まりました。
開催の経緯
JAWSUG金沢側で運用に関する話ってできる人いないっすか?とAWSのコミュニティマネージャの沼口さんに相談したところ、OpsJAWSをつなげていただき、OpsJAWS側もコラボを模索していたため、Win-Winで即決!早速やろうとなって開催したのが今回。せっかくなのでとお誘いいただき、OpsJAWSが出張することに!!!!
無類の鰤好きの私としては、開催時期をしっかり旬を狙って調整したというのはオフレコでwww。
セッショメモ
1. 初心者向け大規模運用と今回の経緯
DMM出村さん
資料探し中
2. CloudWatch Logs 設計Tips
OpsJAWS会澤(私w) https://t.co/14oJEBTYCS
資料ご確認いただき、ご不明点や問題があればご指摘くださいwww
3. AWSで実現するChatOps
DMM @t11a さん https://t.co/aDvvnKqoZz
-
ChatOps導入前
- Code Deployとか使ってるけどマネジメントコンソール手作業
- 作業に4時間
- ヒューマンエラーは避けられない
- リリース頻度は2week/回
-
slashコマンド便利
-
slashコマンドは3sec以内の応答が必須なので、多段lambdaは非同期化
-
たまにデプロイが失敗する。Code Deployのイベントトリガーで通知
-
ChatOps導入後
- slack完結
- 作業に1時間
- ヒューマンエラー激減
- 作業履歴が1か所に
- 作業状況がオープンに
- リリース頻度は1week/回に!
4. AWSの既存サービスを活用して、障害検知・復旧を迅速化するカラクリ
DMM松下さん https://speakerdeck.com/kentarom/jaws-ug-kanazawa-x-opsjaws
- 通知する内容に意味を持たせる(全件通知と閾値通知)
- 通知対象毎にアラームを作成することで、通知時に何のエラーかをわかるように設計
- slackを活用して初動を早める。ChatOpsでスマホでも対応可能!!
- 事例
- 検知から通知まで1-2min
- やるべきリスト整理に30sec
- スモークテストで動作確認
- 3min以内に対応完了!!
5. Systems Manager Update
OpsJAWS園部さん
資料確認中
6. 登壇者トークセッション
- クライアントからエンドポイントまでのレイテンシの管理ってしてるか?というのは興味深い
- いわゆるURL監視でステータスをとるのは鉄板だけど、例えば複数のキャリア・複数の地域からのレイテンシを計測し、閾値超えたらアクセス先を変える(AWSからAzureに、とか)をやってもいいのでは?
正直、予算とか運用者のスキルレベルによってしまうなーと思った。
所感
参加者として
DMMさんでは、DevとOpsは同一チームで行っているので、当たり前のようにDevOps
が回っていました。
自分達が楽になれれば、それが売上や利益の向上につながるため、とても積極的に前向きに取り組まれているな、と感じました。何より、2,3年前は「AWSこれから使います」というステージだったのに、もうここまで来ているか!?と思うほどの活用っぷりで、正直ビビりました。
また、個人的には、今までChatOpsのメリットがなかなかよくわからなかったのですが、何かあったときにPCなくても確認・コミュニケーションが取れるというのは、なるほどなと思いました
。slashコマンドを活用することで、出来ることを増やしている工夫は、当事者ならではのアイディアでとても参考になりました。
運営者として
休憩時間を1時間もとっているのは印象的でした。なかなか皆の前で質問しづらかったりという配慮もあるのですが、ネットワーキングするためにという理由で長い休憩時間をとった
とのこと。これは東京だとなかなかないなーと思いました。
さいごに
勉強会後、懇親会を開いていただきました。
蟹、鰤、さしこ、金沢おでん、などなど、おいしいものをたくさん食べながら交流を深めました。
こういった機会はなかなかあるものではないので、とても貴重な時間となりました。
今後もこういったコラボ勉強開催していけたらなーと思っています。OpsJAWSはどこへでも出没します。他支部の方、ご連絡お待ちしておりますー笑
金沢アツい!!!