はじめに
この記事は、およそ取り止めのない言葉から構成された、雑感とでもいうべき内容ですが、そのようなところから始めることにも、一定の意義があるのではないかと思っています。
NoSQLデータベースのカテゴライズについて
NoSQLデータベースの世界では、JSONを扱うデータベースは、「ドキュメント指向データベース(ドキュメントストア)」と呼び習わされてきました。
「ドキュメント」は普通名詞としてあまりに一般的すぎるため、リレーショナル・構造化データベースに対比して、「準構造化データベース」とでも呼んだ方が、技術的には、実態をよりよく表現することができる、と思います。
あるいは、いっそのことJSONデータベース、と読んだ方が通りが良いとも感じます(Oracle社は、自社のクラウドサービスをそう呼んでいます)。
「準(半)構造化データ」という呼称について
「semi-structured data」という用語には、暗にstructured(構造)イコール、リレーショナルデータベースのテーブル形式、ということが含意されている、と解釈できます。「構造」という言葉を、素直に受け止めるのであれば、これはリレーショナルデータベースに対する行き過ぎた偏向であって、テーブル形式でないデータも、紛れもなく「構造」を持っていると考えられます。
テーブル形式は、リレーショナルデータベースにデータを格納する際の制約である、第一正規化を強制された構造、ということができ、その意味では、「準構造化データ」というよりも、「非第一正規化形データ」とでも呼ぶ方が、実態を表しているのではないでしょうか?
最後に
この記事は、流通している用語を変更するべきと訴えているのではなく、そうした地点から考えてみることを意図しているため、疑問形のセンテンスを投げ出したまま終わります。
参考情報