応用情報技術者平成29年秋期 午前30
データマイニングの説明として,適切なものはどれか。
1、データマイニング(Data Mining)は、
データウェアハウスに蓄積されている大量の生データから、統計学的手法、数学的手法を用いて今まで知られていなかったデータの規則や因果関係を見つけ出す手法です。
2、データウェアハウスの説明
基幹業務のデータベースとは別に作成され,更新処理をしない集計データの分析を主目的とする。
3、データマートの説明 Data Mart
個人別データ,部門別データ,サマリデータなど,分析の目的別に切り出され,カスタマイズされたデータを分析する。
データマート (Data Mart) は、データウェアハウスの中から特定の目的に合わせた部分を取り出したもの。 通常は利用部門が利用目的に合ったデータのみを所持するものである。
※「マート」(mart)は「小売店」
・データマートはデータウェアハウスの一部を指していることがわかりますね。
つまり、
・データレイクはとりあえず情報をたくさん集め、そこから分析結果を得るという「帰納的」アプローチです。
・データウェアハウスは、先に分析理論が確立されており、そのためにデータを集めるという「演繹的」アプローチとなります
4、OLAP(Online Analytical Processing)の説明
スライシング,ダイシング,ドリルダウンなどのインタラクティブな操作によって多次元分析を行い,意思決定を支援する。
・ネットワークを仮想化、分割する技術 「ネットワークスライシング」とは、ネットワークを仮想的にスライス、つまり分割する技術のことです。ここはスライシングとは、多分分割のことでしょう。
・ダイシング(英語: dicing または die cutting)とは、半導体のウェハー上に形成された集積回路などを、ダイシングソーでウェハーを切削して切り出し、チップ化する工程である。
・ドリルダウンとは、データの集計レベルを1つずつ掘り下げて集計項目をさらに詳細にする操作のこと。
・「インタラクティブ」の意味は相互に作用するさまのこと。
参照:
データマートとは? データウェアハウスとの比較から話題のデータレイクも含めて解説!
https://data.wingarc.com/what-is-data-mart-12075