「データアーキテクチャが30分でわかる本」の一章を読んだのでアウトプットする。
#目次
- データアーキテクチャとは
- データアーキテクチャがあるとどうなる?
- ゴール
- 手段
#データアーキテクチャとは
データとビジネスの繋がりを書き出した俯瞰図のこと。
#データアーキテクチャがあるとどうなる?
下記の内容がわかる。
- データがどんなビジネス、どんな業務に貢献しているか
- 業務内容がどんなデータに依存しているか
##要するに?
データとビジネスの紐付けが可視化されている状態にする。
「もうこのデータ使わないから削除してしまおう」という自体を避ける。
アーキテクチャを作成しておくことによって、影響範囲を洗い出せる。
- 機械学習に使用されていないか
- 法務観点で一定期間の保存を義務付けられていないか
etc...
#ゴール
- データが発生してからビジネスに活用されるまでの図が作成されること。
- アーキテクチャ図がメタデータとして保存されていること。
- データとビジネスの繋がりを改善する計画が立っていること。
##手段
①既存のデータアーキテクチャを書き出す
以下の内容をメタデータとして保存する。
データを生み出している部署:データ入力スタッフ、ソフトウェアエンジニア etc...、
データを使っている部署:アナリスト、マーケティング担当、機械学習エンジニア etc...
ここで抑えるべきポイントは3点ある。
- どこからデータを取得しているか
- どこに保存しているか
- どのビジネスに使用しているか
②理想の図を大まかに設計する
不適切なデータの流れを修正する。
二重にデータを作成している部分があったり、古いデータを参照していたり、参照が循環していたりすることがよくある。
どういう流れが理想なのか作図する。
③理想のアーキテクチャで得られるビジネス価値を書き出す
データの流れが綺麗になることによって、生み出されるメリットは何かを書き出す。
- データ保存のコストが抑えられていないか?
- データセキュリティが向上していないか?
- 新たなビジネスチャンスが生まれていないか?
等が考えられる。
③理想と現実のギャップを埋める為の改善アクションを決定する
ビジネス価値とアーキテクチャ改善によるコストをテラソ合わせ、どこから「あるべきデータの流れ」を作成していくかを決定する。