1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

データ基盤問題集

Last updated at Posted at 2022-05-04

問題

データ基盤設計において、統合型データ基盤を採用した場合のメリットを、データレイク型データ基盤を採用した場合と比較して3つ述べよ。

回答例

  1. データレイク型では、blobとしてあらゆるデータを一元管理することでサイロ化を防ぐ設計とするが、統合型では監視・運用基盤をデータ基盤に組み込むことで、設計、実装面での負荷を下げ、サイロ化を防ぐことができる。

  2. データレイク型ではデータクレンジングや加工の為にETLを設計・実装する必要があり、インタフェースやセキュリティ面での設計負荷が高いが、統合型の場合は製品仕様にある程度委ねることができるため、設計負荷が低い。

  3. データレイク型では、blobとしてあらゆるデータを格納・保管することが可能であり、この点RDBMSを採用する統合型は格納データの制限を受けるが、統合管理ツールによってNoSQL及びHadoop等分析基盤とのデータベース越しのグータッチを可能とすることで、格納データの制限を受けにくくすることができる。

解説

データレイク型と統合型を比較しつつ、主に以下3点について論じる。

  1. サイロ化について
  2. 何でもいいから設計負荷について
  3. データベース越しのグータッチについて

データベース越しのグータッチ
異なるデータセットを扱うデータベース(e.g. MongoDBとCosmosDBとRedshift等)間をシームレスに結合・集計すること。頻出表現である。

分散型についても同様に比較することができるようにしましょう。

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?