DynamoDB の基礎知識とまとめ

604

Posted at 2013-10-11

DynamoDBを大雑把にさくっと日本語で理解したい方向けの説明。
(まだ書き途中)

API Version 2012-08-10 を元に書いています。

印象と感想

大雑把に

まずは、公式サイトを読むと概要はわかります。

以下の初心者向けのスライドは、技術的なことも一番わかりやすかったです!

KVS, NoSQL, スキーマレス
プライマリキー (PK, Primary Key)
インデックス (index)
ハッシュ(HASH) とレンジ(RANGE)
型 (type), 属性の型 (Attribute Type)
スカラーデータ型 (Scalar data types)
N,S,B (Number, String, Binary)
マルチバリュー型 (Multi-valued types)
Number Set, String Set, Binary Set
ローカルセカンダリーインデックス (Local Secondary Indexes)
投影された (projected)
データ内容がインデックスに反映された的な意味で使われていると思う
設定では、次の3つから選ぶ KEYS_ONLY, INCLUDE, ALL
プロビジョニングされた (Provisioned)
「リソースが事前に用意されている」という意味
プロビジョニングは、「必要なリソースをすぐに使える体制」という意味
プロビジョンドスループット (Provisioned Throughtput)
Read Capacity Units, Write Capacity Units
DynamoDB Local
DynamoDBのローカル環境

ハッシュかハッシュ&レンジの2つの方法から選ぶべし

HASH を一つのカラムで。
このキーだけで一意に決定して検索できるようにする

HASH のキー & RANGE のキーの2つを使う
HASHとRANGEの2つのキーで一意にレコードを決定できるようにする
RANGE で範囲指定して検索できる

クエリーのためのインデックスをオプションで追加できるようになった。

特徴は、下記サイトからの引用です。

テーブル毎に最大5つのローカルセカンダリインデックスを作成可能
あくまでも従来のレンジキーに対する代替
複数のローカルセカンダリインデックスを組み合わせた検索は不可
従来のレンジキーとの組み合わせも不可
紐付けるAttributeによってコストが増える？

どうやら、3つ以上の条件(Key Conditions)では検索できないようです。
HASHだけか、HASH & RANGE の2つの条件しかできないようです。

テーブルがあって、アイテムがある。
アイテムを探すのにプライマリキーがある。

現状では、後からインデックスの追加ができません。

以下を指定してテーブルを作成する
(API経由でcreateTableする時)

SSD で色々なリージョン、サーバに分散して保存
phpLiteAdmin で DynamoDB のデータ操作ができる
ハッシュキーで別々のサーバに保存するっぽいので、一つのハッシュキーに処理が集中すると遅くなる。ので、分散するように設計しよう
既存のLSI でない DynamoDB テーブルを LSI のテーブルにしたい時は、 Elastic Map Reduce を使って既存のデータをエクスポートしてから、新しいLSIなテーブルへインポートするといい (by Amazon CTO, Werner Vogels)
SQL系DBのトランザクションのようなものはない
→ キューに突っ込む? AWSのSQSなど
query の応答一つあたりのサイズ上限は1MB
Item 64KBまで