TiDB Advent Calendar 2025

TiKVにおけるRocksDBの最適化 — SSTコンパクションガード（２）

Last updated at 2025-12-10Posted at 2025-12-10

このブログは、siddontangの"How We Optimize RocksDB in TiKV — SST Compaction Guard"の抄訳です。翻訳はGeminiの翻訳をベースに、@bohnenが担当しました。

TiDB Xがコンパクションを再考する方法

TiKVのSSTコンパクションガードは、RocksDBにおける書き込み増幅を大幅に削減します。

しかし、次世代アーキテクチャである TiDB X では、さらにその先を行きます。なぜなら、ストレージの基盤全体が変わったからです。

TiDB Xはオブジェクトストレージ（Amazon S3など）上に直接構築されており、これによりリージョン、コンパクション、データ移動に対する考え方が根本的に変わります。

TiKVのシェアードナッシングアーキテクチャでは、ノード間でリージョンを移動するには以下が必要でした。

これはコストがかかります。

しかし、TiDB Xでは：

データはローカルディスクではなく、オブジェクトストレージに存在します。

リージョンの「移動」は、単に新しい計算ノードに同じ基礎データを指し示すことを意味するだけであり、非常に高速で低コストです。

リージョンの移動が安価であるため、リージョンのサイズを劇的に大きくすることができます。

一般的なサイズ：

より大きなリージョンは以下を削減します。

この変更だけで、TiKVで観察された多くのテールレイテンシ（長時間の遅延）の問題が解消されます。

TiKVでは、多くのリージョンが同じRocksDBインスタンスを共有しており、以下の原因となっていました。

TiDB Xでは：

各リージョンが専用の、分離されたLSMツリー（またはストレージスペース）を持っています。

これは大きな利点をもたらします。

この設計により、RocksDBレベルのコンパクション問題の全クラスが解消されます。

各リージョンのデータは分離されているため：

SSTファイルの書き換えはありません。重いコンパクションもなく、コンパクションはリモートで行うことができます。

これは、リージョンが同じLSMツリーを共有していたため、RocksDBでは効率的にサポートできなかったことです。

データはS3にあるため、TiDB Xはリモートコンパクションジョブを実行できます。

リモートコンパクションにより、アクティブな計算ノードに触れることなく、ストレージを積極的に再編成、マージ、クリーンアップ、最適化する自由が得られます。

これは、ストレージとコンピュートの真のクラウドネイティブな分離に向けた大きな一歩です。

これらの最適化が本番環境でどのように感じられるか興味がある方は、TiDB Cloudを無料で試してみてください。