More than 1 year has passed since last update.

APIをバッチ処理で呼び出す場合の考慮事項

Posted at 2022-11-13

バッチ処理とは

CSVなどの大量データを持つファイルを１行ずつ読み込んで処理するもの。

上記の特徴として、対外的なAPI呼び出しは無いことが多いと思われる。

DBやローカルディスクのみを相手にしてきたバッチ処理とは異なる課題がある。

SaaSの場合、（通信速度は）遅い。

SaaSの場合、（処理速度は）速い。

多数の呼び出しが想定されているため、並列実効性に優れる。

APIごとの制約があり、それに抵触する場合、エラーとなり、失敗する。

DBと異なり、ロールバック機能を有していないため、ワンアクションで処理前の状態に戻すことはできない。
このため、適切なロールバック処理を考える必要がある。

呼出先のAPIが一つのSaaSから提供されており、深いリレーションが築けているならば、交渉する。
具体的にはリストデータの受付をできるか交渉する。

効率性を上げる。
もちろん、最初は単一プロセスで動作確認をしてから。

また、並列度は呼出先のAPIのスロットリングの上限を把握するか、抵触しない範囲で、
こちら側の要求を満たす時間幅で考える。