#データベースの種類
大きく二種類に分けます。
・Relational Database
・Non-Relational Database
##Relational Database(SQL)
データ間に関係性がある。データ操作はSQLで行う。
構造化されたデータに適用。例えば、顧客データ、会計データ。
・SQLのメリット:
①調べやすい:データ間に関係性があるから。
②データの一致性:ACID特性
・SQLのデメリット:
①データは行で保存しているので、列のデータを調べたいとき、行から調べるので、I/Oが多い。
②データの一致性を維持するための費用が高い。
③データの構造が決められたため、データの拡張性が弱い。
④検索機能が弱い。
例えば)
”*houkaは頑張*”を検索するとき、
”houkaは頑張り屋。”の検索結果しか出ない。
”houkaと記事を読んでいるあなたは頑張り屋。”の検索結果は出てこない。
##Non-Relational Database (NoSQL)
SQLはメリットがあるので、NoSQLはその不足を補うものです。
SQLと対立の関係ではない。
・構造化されていない、あるいは、半構造化のデータに適用。
・NoSQLの特徴:
①柔軟性
②スケーラビリティ:関係性のあるデータに縛れられず、スケーラビリティが簡単に行える。
③高性能
④高機能
#NoSQL データベースのタイプ
reference: https://aws.amazon.com/jp/nosql/
#増大するデータ量への対応
効率的なデータ蓄積
↓
ストリームデータ処理
↓
大量データの解析手法