プログラミング勉強日記
2021年4月18日
AWSの勉強をしているときに"データウェアハウス"という言葉を見かけて調べてみたらデータベースとの違いがいまいちわからなかったので、備忘録として残す。
データウェアハウスとは
データウェアハウスを直訳すると、"データの倉庫"という意味になる。人によって定義範囲は異なるが、一般的には時系列で整理された大量の等号された業務データやその管理システムのことをいう。
Googleで調べてみると以下のように出てきた。
データウェアハウス(Data Ware House)とは、組織の意思決定を支援するために使用される大規模なビジネスデータを指します
(参考:https://www.talend.com/jp/resources/what-is-data-warehouse/)
データベースとは
データを複数集めて、使いやすいように整理した情報の塊のことをいう。コンピュータで管理するデータをデータベースということが多いが、神で管理している電話帳などもデータベースである。
データウェアハウスとデータベースの違い
1. 分析のしやすさ
一番違うとされているのが、分析のしやすさであり、データウェアハウスは分析に最適化されている。一般的にはシステムが異なればデータの保存状態も違うので、あるシステムから別のシステムにデータを転送するときには大きな負荷がかかる。しかし、データウェアハウスではデータを保存するときに時系列で整理するのでスムーズに分析できる。
2. データ容量の大きさ
データウェアハウスとデータベースでは、蓄積できるデータ量の大きさの違いもある。データベースでは容量を超えてデータが多い場合は、サマリデータの形で蓄積しないといけなくなる。そのため、データベースでは分析が難しくなることがある。データウェアハウスではストレージ容量が多いことが特徴としてある。また、データウェアハウスではデータ分析目的に応じて整理することができる。
参考文献
データウェアハウス
そもそもデータベースとは?基礎から分かるデータベース入門
DWH(データウェアハウス)とデータベースの違いとは?
データウェアハウスとデータベースとの違いは?導入のポイントを解説
データウェアハウスと単なるデータベースの違い