Qiita Engineer Festa20242024年7月17日まで開催中！

Apache Cassandra テーブル数上限覚え書き

Posted at 2024-07-11

はじめに

この記事は何？

Apache Cassandraのテーブル数の上限に関する「覚書」

DataStax社による解説

はじめに、以下の記事から、傍線を引きながら自由に翻訳します。

Cassandra 内の多数のテーブルは、クラスターのパフォーマンスに直接影響を与える可能性があります。通常、クラスター内でアクティブに使用されるテーブルは 200 個以下にする必要があります。アクティブに使用されているテーブルが 500 個ある場合は、非効率性や障害が発生する可能性が高いため、クラスターが機能していても障害レベルとみなされます。

この問題は、すべてのテーブルがメタデータにほぼ1 MBメモリを使用するために発生します。動作するテーブルごとに、memtable 表現が割り当てられます。大量のデータを含むテーブルでは、ブルームフィルターやその他の補助データ構造により多くのデータが保存されるため、メモリへの負荷も増大します。また、各キースペースにより、JVM メモリに追加のオーバーヘッドが発生します。これらすべての要因が Cassandra のパフォーマンスに影響を与えます。次のベンチマークは、テーブル数の増加に伴ってスループットが大幅に低下することを示しています。

テーブル数上限の存在することが正当化されるべき背景に関する理解

以下は、Cassandraに限った話ではなく、一般的な考え方として。

分散データベースにおいては、複数のノード間でメタデータを共有する必要があります。
このメタデータは「常に」更新状況が監視される必要があります。
「常に」ネットワーク上を流れ続けるデータの制御を考えた場合、その単純増加要因となる管理対象（テーブル）の数に上限が存在するのは自然なことであり、そのことを意識した管理が必要になることになります。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Apache Cassandra テーブル数上限覚え書き

はじめに

この記事は何？

DataStax社による解説

関連する設定

`cassandra.yaml`

`guardrails` [Default: disabled]

`tables_warn_threshold` [Default: -1 (disabled)]

`tables_failure_threshold` [Default: -1 (disabled)]

テーブル数上限の存在することが正当化されるべき背景に関する理解

Apache Cassandra テーブル数上限覚え書き

はじめに

この記事は何？

DataStax社による解説

関連する設定

cassandra.yaml

guardrails [Default: disabled]

tables_warn_threshold [Default: -1 (disabled)]

tables_failure_threshold [Default: -1 (disabled)]

テーブル数上限の存在することが正当化されるべき背景に関する理解

`cassandra.yaml`

`guardrails` [Default: disabled]

`tables_warn_threshold` [Default: -1 (disabled)]

`tables_failure_threshold` [Default: -1 (disabled)]