Cassandraとは
Amazon Dynamoの分散ハッシュテーブル(DHT)と
Google Big TableのKVSの
2つの特徴を併せ持つビッグデータ用分散データベース
特徴
・オープンソース
・単一障害点(SPOF)がない
・高速パフォーマンス
・リニアなスケーラビリティ性能
・継続的可用性
・すべてがアクティブな設計
・透過的にエラーを検出、回復
・柔軟なNoSQLデータモデル
・シンプルな運用管理
・様々な無償ツールとドライバ/コネクトをもつ
・データの整合性を選択可能(CAP定理・BASE)
・マルチデータセンター レプリケーション
・CQL (Cassandra Query Language)
#詳細
単一障害点 ( SPOF ) がない
Cassandraはマスターという概念がありません。
全てのノードが完全に同じ機能を持っているため、
ノードが故障しても同じデータを持っている他のノードが
同じ作業を、全く問題なく処理することが可能です。
高速パフォーマンス
マスターレスであり、すべてがアクティブな設計のため、
すべてのノードが読み書き可能です。
よって
多数のクライアントからの
同時書き込み・読み込みが可能です。
リニアなスケーラビリティ性能
マスターレスな設計のため、
運用がシンプルでスケールアウトが容易に行えます。
ダウンタイムなくノードを追加することができます。
ノードを増やすことによりデータが分散され、
1ノードの持つデータ量が減るため
パフォーマンスの向上が予測可能になります。
柔軟なNoSQLデータモデル
最新のデータタイプに対応し、高速に読み書き可能です。
データの整合性を選択可能
広く分散されたクラスタに渡り、
ポリシーによってデータの整合性を調整することが可能です。
CQL (Cassandra Query Language)
SQLに似た言語を備えているため、
リレーショナルデータベースから非常に容易に移ることができます。
#参照
Apache Cassandra
http://cassandra.apache.org/
Apache Cassandra (source code)
https://github.com/apache/cassandra
DataStax Document (DataStax,inc)
http://docs.datastax.com
Cassandra コミュニティー
http://cassandra-jp.com/
Cassandra サポート (株式会社INTHEFOREST)
https://www.intheforest.co.jp/