アジェンダ
1. 概要
2. 前提
3. 実装方法
4. 追加検証
5. 所感
6. さいごに
概要
AWSはAmazon DataZone(以下DataZone)の一般提供を開始しました。
Datazoneでは以下のようなことができると発表されています。
・組織の枠を越えてデータを大規模にカタログ化、発見、分析、共有、管理
・データプロデューサー(※)とコンシューマー(※)がより安全にデータを共有
(※):データプロデューサー:管理者
(※):コンシューマー:利用者
本記事ではDataZoneの使用方法や、
AWS内の他のサービスとの権限の干渉の有無について検証しております。
Datazoneとは
Datazoneを簡単な図にしました。
散在するデータを管理者がDatazone上でカタログ化し、一元管理ができます。利用者は申請をするだけでプロジェクト内のデータを分析することができます。また、用語集を作成することができるため、ユーザによってより易しくなるといえます。
前提
・アジアパシフィック (東京)
※IAMはDatazoneのドメインと同じリージョンに設定する必要あり
・AWSにアクセスできる環境があること
※ユーザのセットアップなどは省略
実装方法
基本こちらを参考に実装しております。
①AWSにユーザがありログインできることを確認します。
②今回必要な権限をまとめたユーザグループを作成するため
検証ユーザをそのユーザグループに追加します。
Datazoneのフルアクセスを付与します。
③Amazon DataZoneがユーザーに代わってAWSマネジメントコンソールで必要なロールを作成できる権限を付与します。
④ドメインのリソース共有を一覧表示、承認、拒否するために必要なアクセス許可を付与します。
⑤AWS 認証情報を使用してデータポータルにアクセスするために必要なアクセス許可を付与します。
⑥Redshiftにクラスターを構築しサンプルデータを格納する
⑦DatazoneとRedshiftの接続にはシークレットアクセスキーが必要となるためSecretsManagerでキーを作成する
⑬環境プロファイルを作成する
※環境を作成するために必要なフォーマットのようなもの
⑮Redshiftにサンプルデータなどを用いてテストテーブルを作成する
⑱サブスクライブを申請
→サブスクライブをすることで他のアカウントにテーブルのアクセス権限を付与
⑲プロジェクト名とリクエストの理由を記入しサブスクライブを申請
追加検証
追加検証として以下の内容を検証した。
-
Redshiftへ接続するIAM権限がないユーザーが、
Datazone側のサブスクライブの有無で接続可能になるのか -
テーブルへ接続ができないユーザーが、
Datazone側のサブスクライブの有無で接続可能になるのか
1: Redshiftへ接続するIAM権限がないユーザーが、
Datazone側のサブスクライブの有無で接続可能になるのか
→IAM権限がないユーザーでも接続が可能
→ユーザーがDatazone由来のユーザーでログインしているため
→サブスクライブが承認されていない場合は接続不可
2: テーブルへ接続ができないユーザーが、
Datazone側のサブスクライブの有無で接続可能になるのか
→テーブルに権限がないユーザーでも接続が可能
→ユーザーがDatazone由来のユーザーでログインしているため
→サブスクライブが承認されていない場合は接続不可
所感
・Datazoneのサブスクライブでテーブルのアクセス可否を一括管理ができる
→適切なユーザーが適切な目的で適切なデータにアクセスできるように
→操作性も非常に簡単
・プロジェクト全体でデータアセットを一元管理できる
→データが散在することがなくなる
・AWS Glue Data Catalogと異なりデータを同期する頻度や
連携するテーブルなどの内容を自由に設定可能
さいごに
株式会社ジールでは、「ITリテラシーがない」「初期費用がかけられない」「親切・丁寧な支援がほしい」「ノーコード・ローコードがよい」「運用・保守の手間をかけられない」などのお客様の声を受けて、オールインワン型データ活用プラットフォーム「ZEUSCloud」を月額利用料にてご提供しております。
ご興味がある方は是非下記のリンクをご覧ください:
https://www.zdh.co.jp/products-services/cloud-data/zeuscloud/?utm_source=qiita&utm_medium=referral&utm_campaign=qiita_zeuscloud_content-area