そのほかのデータベース
システムの構造が巨大化・複雑化とともに従来のリレーショナル型やキーバリューストア型以外のデータのタイプが出現した。
- DocumentDB(ドキュメント指向型)
- Neptune(グラフデータベース)
- Timestream(時系列データベース)
- Quantum Ledger Database(台帳データベース)
Amazon DocumentDB(MongoDB 互換)とは
Amazon DocumentDBは、Mongo互換のデータベースサービス。
MongoDBとは、オープンソースのドキュメント指向型のデータベース。
JSON形式をバイナリ化したBSON形式でデータを保存する。
ビックデータ処理、分散処理に向けたNoSQL型のデータベースで高い評価を得ている。
DocumentDBは、MongoDBデータの入出力を大規模かつ安定して行えるように最初から設計されている。既存のMongoDBドライバーおよびツールで利用できる。
AWS Database Migration Serviceを用いて、Amazon EC2上で実稼働中のMongoDBデータベースをAmazon DocumentDBに実質ダウンタイムなしで移行できる。
Amazon Neptuneとは
Amazon Neptuneは、「グラフデータベース」。
グラフデータとは、色々な要素間の関係や、処理の流れを示すために、ノード同士の連結を方向を含めて記述した内容。Amazon Neptuneは代表的なグラフモデルであるProperty GraphをW3CのRDF、それぞれのクエリ言語であるApache TinkerPop GremlinとSPARQLに対応している。管理は自動化されていて、ネットワーク越しのデータの読み込みはHTTPSで暗号化されている。
レコメンデーションやソーシャルネットワーク、ナレッジグラフなどで必要とされる、データ間の複雑な関係を扱える。
Amazon Timestreamとは
Amazon Timestreamは「時系列データベース」のサービス。
時系列データとは時間お経過に伴う事柄の変化を記録したデータで、IoTの典型的なデータ取得形式。時間感覚で取得したデータをリレーショナルデータベースに保存することはできるが、集約や集計が用意でなくなる。
Amazon Timestreamでは、クエリ処理エンジンが時間間隔別に最適化されているので、平滑化・近似・補完などの分析関数が最初から組み込まれている。リソースが競合しないように新たなエータの挿入と既存のデータからクエリを異なる処理階層で実行する。必要に応じてスケーリングするので、初めに容量や負荷を考える必要がない。IoTデータを扱うパフォーマンスを維持し、データ管理コストを抑えることができる。
Amazon Quantum Ledger Database(QLDB)とは
Amazon Quantum Ledger Database(QLDB)は台帳データベース。
台帳では、企業などの商取引や財務の記録に加えて監査も必要。リレーショナルデータベースでは監査に必要とされる「データ変更の追跡や検証」に本来対応していないので、カスタムな監査用アプリケーションの開発に時間と手間がかかる。
Amazon QLDBでは、データの各変更を追跡し履歴として維持する「ジャーナル形式」を採用している。ジャーナル内のデータは変更・削除不可で、暗号学的ハッシュ関数で変更履歴の改竄を防止している。一方で、SQL類似のAPIや柔軟なドキュメント指向データモデルなどが備わっているので、操作が簡単。