6
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ZOZOAdvent Calendar 2024

Day 21

フロントエンドエンジニアからSREに転生したので1年間を振り返る

Last updated at Posted at 2024-12-23

はじめに

今回は、フロントエンドエンジニアとして内定をいただいた私が、SREとして配属されてからの1年間を振り返り、どのように過ごし、何を学んできたかを共有したいと思います。

フロントエンドからSREを志望した理由について気になる方は、以下の記事もぜひご覧ください。

4月〜12月の業務

4月 - 新卒研修

  • ビジネス・マナー研修(2週間)
    • 一般的なビジネス知識を講師の方を招き教えていただきました。
    • また、「ZOZOらしさ」をテーマにしたグループワークが特徴的で、深い学びが得られました。
  • プロダクト開発研修(2週間)
    • 講義型の技術研修ではなく、ハッカソン形式で行われました。特に、ビジネスサイドやデザイナーと同じチームで開発する経験は貴重で、多くの学びがありました。

5月 - 新マイクロサービスの初期構築案件【メイン】

新マイクロサービスの構築を行いました。

  • AWSリソースの作成
  • k8sリソースの作成
  • CI/CDパイプラインの整備
  • Firehose
  • Pod用SG
  • Sentryの構築

6月 - 負荷障害試験【メイン】, CI/CDの改善【メイン】

弊社では日々マイクロサービスへのリプレイスが進んでおります。
リプレイスされたAPIでは負荷障害試験が実施されます。

  • 負荷試験
    • gatlingを用いた負荷試験
  • 障害試験
    • 試験項目の作成
    • 試験の実施

また並行してCI/CDの改善も行いました。

  • Github公式でも推奨されているAWS接続のためのOIDC対応の推進

7月/8月 - デプロイワークフロー改善【メイン】, KEDAによるコスト削減【メイン】, 新卒勉強会の開催

  • ECRへの効率的なPushを可能にするパイプラインの整備。
  • KEDA導入に向けた準備
    • KEDA導入によるコスト削減の実施に向けた準備
    • Pod深夜停止におけるアラートの洗い出しおよびdatadogダウンタイムの設定
  • KEDAのdev, stg, prd環境導入
    • 管轄サービスへのKEDA導入を行いました。
  • 新卒勉強会開始に向けた準備と開催
  • エンジニア, デザイナー, PM混合でのLT勉強会を主催しました。(10月まで実施)

9月/10月 - マスターデータ連携バッチの構築【サブ】, リリース直後の400エラー検知【メイン】

  • ArgoWorkflowを用いたマスターデータ連携バッチの構築
  • 恒常的に400エラーが出ているマイクロサービスで、リリース直後に400エラーが増加した際に切り戻し判断のためのアラートの設計・実装を行いました。
    • Flaggerを用いたProgressive Deliveryと400エラーの監視を組み合わせ、適切な切り戻し判断を可能にするアラートを設計・実装。

10月 - 認証系マイクロサービス鍵交換【メイン】, SMS認証サービス移行N%リリース【メイン】, ArgoWorkflowアラートの作成【メイン】

  • IDトークン検証用の鍵交換を実施。
    • IDトークンの入れ替えは手順が細かくあり、失敗すると障害に直結するためバックエンドチームと密に連携し時間をかけて行いました。
  • 障害発生時の影響を最小限にするため、手動カナリアリリースを実施。

  • ArgoWorkflowで作成したバッチの成否を検知するためのアラート作成

11月 - 年末負荷試験のシナリオ作成・実施

  • Akamai Cloud Testを活用した負荷試験シナリオを作成し、他部署を巻き込んだ調整を実施。

12月 - AWS re:Invent 2024, 負荷試験【メイン】

  • AWS re:Invent 2024へ参加しました!詳細は以下の記事をご覧ください。

  • リプレイスに伴うマイクロサービスの負荷試験を実施しました。
  • KEDAによる日中スケール
    • KEDAによるCronスケールを導入し、日中のスパイクに対応可能な環境を構築。

通年業務

  • アラート対応
  • 問い合わせ対応

苦労した点

1年間の振り返りを通じて、多くの案件を任せていただいたと実感しました。一方で、技術的知識を都度キャッチアップしながら進めたため、楽しくも悩ましい1年でした。特に以下の点で苦労しました:

  • 400エラー検知のアラート設計
  • 年末負荷試験シナリオの作成

これらの課題はメンターやチームの助けを得て乗り越えることができました。部署・チームの皆様に感謝申し上げます!
しかし、メンターの方やチームの方に助けていただきなんとか乗り切ることができました。部署・チームの皆様大変お世話になりました!!

来年に向けて

まだまだ進行中の案件がたくさんあり、来年度も大変になると思いますが、1つ1つの案件に対して日々進歩で楽しみながら進めていければと思います。

また、2年目に求められる高度な知識や設計能力を身につけ、成長していきたいです。気合を入れて頑張ります!

最後まで読んで頂きありがとうございました!
少しでも参考になればいいねして頂けると嬉しいです!

6
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?