背景・目的
最近、データカタログのSaaS製品である「Select Star」について知る機会がありましたので、特徴を整理します。
まとめ
下記の特徴をまとめます。
特徴 | 説明 |
---|---|
Select Starとは? | データを自動的に分析し、文章化するインテリジェントなデータ検出プラットフォーム |
データに関する課題 | ・データサイエンティストやビジネスアナリストは、データ検索に多大な時間を費やしている ・データの検索を依頼するために過度な時間を費やしている |
提供機能 | 誰でもデータを検索し、理解するために使用できる使いやすいデータポータルを提供する |
High Level Architecture | ・DWHとBIに直接接続 ・各データソースからメタデータ、クエリ履歴、アクティビティログを取得 ・メタデータとクエリ履歴を、クエリパーサーを介して統合メタデータストアにいれる ・クエリパーサーにより、どのようなデータが存在するか、どこに存在するか、データがどのように使用されるか分析する ・データリネージュも確認できる |
Integration | ・DWH ・BI / Data Visualization Tools ・ETL & Other Tools |
Pricing
Pricingを下に整理します。
2024/4/21現在の情報です。
最新は、Pricingをご確認ください
Pro、Growth、Enterpriseがあります。
カテゴリ | 特徴 | Pro | Growth | Enterprise |
---|---|---|---|---|
基本情報 | 価格 | $ 300/月 | $ 900/月 | カスタム |
データソース | 1本 | 2本 | 無制限 | |
ユーザ | 10人 | 25人 | 100+ | |
テーブル | 250 | 1000 | 4000+ | |
標準 | 自動化されたメタデータカタログ | ◯ | ◯ | ◯ |
自動人気ランキング | ◯ | ◯ | ◯ | |
タグと所有権の割当 | ◯ | ◯ | ◯ | |
ディスカッションとコメント | ◯ | ◯ | ◯ | |
ドキュメントと指標 | ◯ | ◯ | ◯ | |
ユーザとチームの分析 | ◯ | ◯ | ◯ | |
高度な機能 | Slack統合 | アドオン | ◯ | ◯ |
Chrome拡張 | アドオン | ◯ | ◯ | |
dbtドキュメント動機 | - | ◯ | ◯ | |
AIドキュメント | - | ◯ | ◯ | |
SSO | - | アドオン | ◯ | |
APIアクセス | - | アドオン | ◯ | |
メタデータPIIの検出 | - | アドオン | ◯ | |
きめ細やかなアクセス制御 | - | アドオン | ◯ | |
Snowflakeのコストと分析 | - | アドオン | ◯ | |
エンタープライズサポートとユーザーオンボーディング | - | アドオン | ◯ | |
カスタマイズ可能なオプション | SAMLディレクトリ同期 | - | アドオン | アドオン |
シングルテナントVPC | - | アドオン | アドオン | |
EUの展開 | - | アドオン | アドオン | |
カスタム統合 | - | アドオン | アドオン |
概要
What is Select Star?
Select Star は、データを自動的に分析して文書化するインテリジェントなデータ検出プラットフォームです。
- データを自動的に分析し、文章化するインテリジェントなデータ検出プラットフォーム
多くのデータ サイエンティストやビジネス アナリストは、適切なデータの検索に多大な時間を費やしており、他の人にデータの検索を依頼するために過度の時間を費やしていることがよくあります。
- データサイエンティストやビジネスアナリストは、データ検索に多大な時間を費やしている
- データの検索を依頼するために過度な時間を費やしている
Select Star は、誰もがデータを検索して理解するために使用できる使いやすいデータ ポータルを提供します。
- 誰でもデータを検索し、理解するために使用できる使いやすいデータポータルを提供する
High Level Architecture
出典:Select Star > High Level Architecture
Select Star は、データ ウェアハウスと BI ツールに直接接続し、各データ ソースからメタデータ、クエリ履歴、アクティビティ ログを取得します。
- DWHとBIに直接接続する
- 各データソースからメタデータ、クエリ履歴、アクティビティログを取得する
メタデータとクエリ履歴が Select Star に入ると、クエリ パーサーを介して統合メタデータ ストアに入ります。クエリ パーサーは、どのようなデータが存在するか、どこに存在するか、およびデータがどのように使用されているかを分析します。
- メタデータとクエリ履歴を、クエリパーサーを介して統合メタデータストアに入る
- クエリパーサーにより、どのようなデータが存在するか、どこに存在するか、データがどのように使用されるか分析する
そのクエリ履歴に基づいて、何が使用されているのか、何が使用されていないのか、誰が何を使用しているのかに基づいて人気度が自動的に計算されます。この人気は、Select Star のすべてのデータ オブジェクトに現れています。
- クエリ履歴により、何が使用されているのか、何が使用されていないのか
- 誰が何を使用しているのかに基づいて人気度が自動で計算される
デフォルトでは、テーブル内のすべての列、データベース内のすべてのテーブル、BI ツール内のすべてのダッシュボードが Select Star の人気順に並べられるため、最もよく使用されているものを常に最初に確認できます。
- テーブル内の全ての列、DB内のすべてのテーブル、BIツール内の全てのダッシュボードがSelect Starの人気順に並べられる
出典:Select Star > High Level Architecture
Select Star の各テーブルとダッシュボードにはデータ系統モデルが表示され、データの依存関係、データの取得元、使用場所を 1 か所から簡単に確認できます。
- データリネージュが表示される
- データ依存関係、データの取得元、使用場所を一箇所から簡単に確認できる
出典:Select Star > High Level Architecture
Integrations
Integrationsを下に整理します。
- ACLで絞っている場合、公開されているIPをホワイトリストに登録する
Cloud Data Warehouses
- Snowflake
- Databricks
- BiqQuery
- Redshift
- PostgreSQL
BI / Data Visualization Tools
- Tableau
- PowerBI
- Looker
- Mode
- Sigma
- Sisense
- Metabase
- Looker Studio
ETL & Other Tools
- dbt
- AWS Glue
Other Platform APps
- Slack
考察
Select Starを使うと、データカタログを作成できます。ビジネスメールアカウントのみ、アカウントが作成可能で今回は試すことができませんでしたが、ドキュメントを見る限り、通常のカタログに加えて、リネージが確認できるようでした。
参考