シャーディングとは、シャードが枯渇するとは？

Posted at 2025-08-02

データベースのシャーディングって何？そしてシャードが枯渇するってどういうこと？

こんにちは！この記事では、よく聞く「シャーディング」について軽くおさらいしつつ、
「シャードが枯渇する」ってどういうことなのか？を調べたのでまとめます。

簡単に言うと、データを複数のデータベース（≒シャード）に分割して管理することです。

1つのDBにデータが全部詰まってると重くなるし、スケールもしづらい。
なので「ユーザーIDの1〜100万はこのDB」「100万〜200万はこっち」みたいに水平分割してあげるわけですね。

「スケールしやすくていいじゃん！」って話なんですが、うまくやらないとシャードが枯渇するという落とし穴があるんです。

「シャードが枯渇」＝そのシャードが限界超えて苦しんでる状態です。

以下のような状況を指します：

「ユーザーIDでシャーディングしてたら、人気VTuberのファンがたまたま全員同じ範囲に固まってて、
そのシャードだけアクセス過多で死んだ」みたいなこと、普通にあります

これは使ってるDBやインスタンスによってバラバラですが、ざっくり目安として：

もちろんCPU、RAM、インデックス設計、クエリ最適化などでも大きく変わります！

原因の多くはデータ分布やアクセスが偏ってしまうことです。

対策	説明
シャーディングキーの見直し	偏りにくいキー（例：UUIDやハッシュ値）を使う
モニタリング強化	CloudWatch, Datadogなどでホットシャードを早期検知
再シャーディング可能な構成	シャードを動的に増減できるような設計にする
RedisやS3などの外部ストレージ併用	一部データはRDB以外に逃す設計にする
書き込み分散	書き込みピークを吸収するキュー設計なども有効

　おしまい