LoginSignup
15
15

More than 1 year has passed since last update.

マイクロサービスのトランザクション管理をデザインする(事前知識編)

Posted at

はじめに

今回は、2年程システムのマイクロサービス化を進めてきて順調にサービスの数も増えて複数マイクロサービス間のトランザクションに対して本腰を入れて考えなければいけなくなってきたので複数回にわたって投稿していきたいと思い投稿した初回になります。

構想としては以下のように全3部以上の構成で考えています

  1. 事前知識編
  2. 実践編(要件・基本設計)
  3. 実践編(実装・運用経過)
  4. 実践編(3で実装したこと以外のパターンを採用した場合は都度)

トランザクションの種類

トランザクションの種類としては以下の2つがあります。

  • ローカルトランザクション
    単一トランザクションで単一リソースに対しての処理のみを行う

  • グローバルトランザクション
    単一トランザクションで複数リソースに対して処理を行う

    • トランザクションをネストさせる → DBがクラッシュしたらデータの更新状態は不明となる
    • XAトランザクション → Prepare状態ならDBがクラッシュしても更新状態は残っている。
      ※ XAトランザクションのデメリットとしては2フェーズコミットによるロック時間・トランザクションマネージャーが少ない(goとNode.jsではいまのところ出会っていない)

マイクロサービスでは

ローカルトランザクションをすすめています。

グローバルトランザクションは以下のデメリットがあると言われています

  • ブロッキングプロセスであるための関連DBが増えた際の高遅延と低スループット
  • トランザクション間のロックの管理の複雑さ
  • トランザクション管理の複雑さ(複数Nodeの管理)

そこで出てくる考え方がBASEです。

BASE

  • Basically Available(可用性)
  • Soft-State(一時的な不整合は許容する)
  • Eventual Consistency(結果整合性)

また複数サービスにまたがるという事はネットワークを経由すると言うことなのでCAP定理もふまえて設計をしないといけません。

CAP定理

分散システムはこの以下3つのうち、同時に2を満たすことはできるが、同時に全てを満たすことはできない.

  • Consistency (一貫性)
  • Availability (可用性)
  • Tolerance to network Partitions (ネットワーク分断への耐性)

どのように整合性を保つ為の複雑さに立ち向かうのか?

マイクロサービスのトランザクションでは結果整合性がポイントになります。
いままで、なにかしらの登録/更新/削除処理をリクエストし、その結果が返ってきたら「データベースへの処理は全て完了している」という思考(ACID)からの脱却が必要になってきます。

それでは結果整合性を達成する為の方法としては何があるでしょうか。

TCC(Try-Confirm/Cancel)パターン

2phase commitに類似したパターンです。
Try/Confirm/Cancelの3つのAPIを用意して、登録状態を変更していく方式です。

メリット
  • 初めの状態は本登録ではなく仮登録なので後述で説明する補償トランザクションでのロールバックでは都合が悪い場合に有効
デメリット
  • 全ての状態においてtryとconform/cancelのステップをおこなわなければならず処理時間がSagaと比較すると2倍。
  • 全ての参加Nodeの状態を確認してからconform/cancelのステップに進むので、Node数が多くなるとSagaと比べると処理時間が比例して増加する。

qiita-20220306-tcc.png

Sagaパターン

イベント駆動式のパターンです。
TCCパターン違い、Tryという仮登録状態を持ちません。
全てを正式登録していき、ロールバックが必要な事態になった場合は補償トランザクションという処理の流れを逆向きの操作し、取り消し操作を行っていきます。
取り消し操作はレコードの論理削除かもしれませんし、物理削除かもしれません。ここは状況によりきりなのでProject毎に違うと思います。

メリット
  • 補償トランザクションにrollbackが発生しないかぎりは1ステップで各Nodeの処理が完結するので処理時間が短くなる
  • 登録状態管理がシンプルになる。
デメリット
  • 補償トランザクション管理の複雑さ。
  • 取り消しがきかない処理の場合は不向き。

qiita-20220306-saga-saga.png

しかし、上記2つのパターンは結果整合性の手段でありネットワーク分断の可能性とシステム不具合を解決できるわけではありません。
そこで、MQを使ったリトライ処理やバッチや手動による補填処理などがプラスで必要になります。
※ リトライ処理には冪等性を考慮した仕組み作りも必要です。
こちらのメルペイでの事例では、リコンサル処理でデータの整合性信頼度を上げていたりもします。

結果整合性といっても、整合性を担保する事には違いないので2重3重の仕組みが必要ということが伝わってきます。

今回のまとめ

今までモノリスなシステムの設計になれてしまった私たちには、マイクロサービスは巨大な壁です。
今マイクロサービスという巨大な壁に立ち向かっている人には「いままでのトランザクション管理でも頭を悩めていたのに、それからさらに複雑なことをしないといけないのか...」と思う人も多いと思います。
おそらく小規模でモノリスなシステムで問題ない要件なら、無理にマイクロサービスに取り組むことはしない方が良いでしょう。
複雑さに立ち向かうほどに得られるメリットがないなら、立ち向かうにはあまりにもコストが大きいことは確かです。

しかし、DX化が求められる昨今の流れを考えると社内システムなら外部Saasとの連携。決済を必要とするサービスならstripeなどのSaasとの連携は必要となるはずです。
自社のシステムをマイクロサービスにしなくても、自然とシステムは分散されているかもしれません。

次回は、現在開発中のトランザクション処理がリリースされた段階でな「ぜその設計にしたか?」の部分を投稿できればと思います。

15
15
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
15
15