はじめに
TiDBアドベントカレンダー2025の8日目として、ここ1年のTiDB Cloudの進化を振り返って見ようと思います。TiDBカーネルの更新に追随しているのはもちろんですが、マネージドサービスとしての1年間の更新を見ることで、現在のDBサービスに求められているものが見えてくるのではないでしょうか。
TiDB X(TiDB Cloud Starter/Essential/Premium)の発表
TiDB Cloudのラインナップとして、TiDB X1が発表されました。
これはTiDB Cloud Dedicatedとは別の、サーバレスDBのラインナップになります。実際、TiDB Cloud Starterは、今年の半ばまではTiDB Cloud Serverlessと呼ばれていました。
TiDB Xの大きな特徴は、インフラの前提としてクラウドPaaSを想定しているところです。具体的にはオートスケールを可能とするスケーラブルなコンピューティングリソースと、可用性が非常に高く、IOPSの心配がいらないオブジェクトストレージです。
基本的なアーキテクチャはTiDB Serverlessと同様です。S3を主要なストレージとして、TiKVのローカルストレージにコピーして利用します。
TiDB ServerlessはTiDBの複雑さを意識することなく、共有インフラで従量課金・安価に提供できるというコンセプトでしたが、TiDB XはTiDB Dedicatedにあるようなエンタープライズに必要な周辺機能や、予約可能なキャパシティが特徴となっています。
TiDB Xのラインナップの拡充の背景には、TiDBの使われ方の影響があります。TiDB Cloud Dedicatedの少なくない顧客はクラスタのサイズを定期的に変更します。その際、TiDBコンポーネントのうちステートレスなTiDBはノードが起動すればすぐに利用できるのに対し、TiKVコンポーネントはデータが空の状態で起動するため、どうしてもデータのリバランス(他のTiKVノードからデータをコピーする)が必要となり、時間がかかってしまいます。
そのため、一時的なTiKVの能力増強としてはスケールアップ・ダウンを推奨しています。
TiDB Xのアーキテクチャでは、他のTiKVノードからデータをコピーする必要がありません。S3から必要なデータをコピーして、ノードを起動することができます。これによりスケーラブルな動作を可能としています。
個人的にはこのようなスケーラビリティ、オートスケールを持つデータベースは年々増えてきていると思います。KVSのマネージドデータベースが代表ですが、RDBMSでもAurora Serverless、Limitless、DSQLやCloud Spanner、Neonなどがあります。
単に管理面の容易さだけではなく、業務ワークロードに波があり、クラウドの特性を活かしたスケーラブルなアーキテクチャが求められる背景があると感じています。
TiDB Cloud on Azureの発表
これも大きなリリースでした。TiDB Cloud DedicatedがMicrosoft Azure上で利用可能になりました。これにより3大クラウド上の全てでTiDB Cloud Dedicatedを利用することが可能になります。
分散SQLデータベースはクラウドベンダー各社が提供していますが、まだ自社クラウドのみでの提供が大半です。どのクラウドでも利用できるという点は、複数のクラウドを利用している大きな組織にはメリットがあるでしょう。
なお、マネージドサービスでないTiDB(コミュニティ版、Self-Managed版)は、x86やARM上のLinuxで動作するので、原則どのクラウドであっても動作可能です。その場合はインスタンスなどの管理は利用者が行うことになります。
AI関連機能の強化(全文検索・Auto Embedding)
TiDB Cloud Starterで全文検索機能をサポートしました。
また、ドキュメントなどをベクトル化して埋め込む、AutoEmbeddingができるようになりました。これによりSQLだけでベクトル化を行えます。
昨年のVector型・インデックスのサポートに続く、LLMからDBを利用する場合の機能強化になります。LLMからデータを検索する場合に、ワンストップでできるようにDBの対応範囲を広げるという意図があります。
DBのLLM対応については、DB業界を見渡しても急ピッチで進んでいる印象です。これにはデータベースの利用者が人間から(正確には人間の作ったアプリケーションから)AI Agentに変わっていくだろうという認識があります。
ユーザーが変われば、データベースに求められる機能も変わります。Manusの事例では、AIスタートアップの急激に増加するユーザー数に対応するスケーラビリティと、Agentの並列実行にTiDB Cloud StarterのBranching機能が有効活用されています。
このような機能強化は今後も実装されていくことでしょう。
その他機能強化など
性能面では、Raftに利用するストレージとRocksDBが利用するストレージを分けるStorage Classの変更がありました。
そのほか、Node Groupといった地道な機能強化と、サードパーティメトリクス連携の刷新などが行われました。
ユーザーのフィードバックを元に、開発サイクルを回して稼働サービスに対して更新をかけていくのはどのSaaSでも行われていると思います。目立つ新機能も良いのですが、地道な性能改善や機能強化もケイデンスを保って行い続けていきたいものですね。
おわりに
まとめてみると大きな発表の多かった1年だったなという気持ちです。特にTiDB Xラインナップの拡充は、TiDBがShared Nothing と Shared everythingの両方のストレージパターンをサポートすることになりました。来年はこれが実際のユーザーどう評価・活用されていくのか、その上で求められている機能は何かという点で面白くなっていくと思います。
-
個人的にはXなのはTiDB 10年目にちなんでだと思うのですが、名前の由来は未確認です。 ↩