・データベース
一定の規則に従い、関連性のあるデータを蓄積したもの
・DBMS(データベース管理システム)
複数の利用者で大量データを共同利用できるように管理するソフトウェア
・関係データベース
データを行と列による二次元の表形式で管理する
一行が一件のデータを、列はそのデータを構成する項目を表し、表同士が表中の列の値で関連付けられている
RDBMS
関係データベースのDBMS
データの検索や挿入、更新、削除などのデータ操作にはSQLと呼ばれる言語を使う
表(テーブル)、行(レコード)、列(フィールド、項目)
・NoSQL
関係データベースとは異なる方法で、データを保存し処理するデータベース全般
NoSQLのデータベース
キューバリューストア型
保存したいデータと、そのデータを一意に識別できるキーを組みとして管理する
カラム指向型
キーに対するカラム(項目)を自由に追加できる
ドキュメント指向型
ドキュメント1件が一つのデータとなる。データ構造は自由
グラフ指向型
グラフ理論に基づき、ノード間を方向性のあるリレーションでつないで構造化する
・データウェアハウス
多種多様なデータを、時系列に整理・統合して蓄積したデータベース
これを用いて企業の意思決定を支援するBIツールがある
・データレイク
多種多様なデータを、発生したままの形式で蓄積した保管場所
・エンタープライズサーチ
企業内に保存されている様々な情報から、必要な情報を検索、抽出できるシステム
・関係演算
選択(指定した行を抽出する)
射影(指定した列を抽出する)
結合(複数の表を一つの表にする)
・集合演算
同じ列で構成される二つの表から新しい表を作り出す演算
和演算(二つの表にある全ての行を取り出す。同じ行は一つにまとめる)
積演算(二つの表に共通している行を取り出す)
差演算(一方の表から他方の表の行を取り除く)
・データクレンジング
データベース化のために集めたデータを修正し、分析しやすい状態にすること