LoginSignup
3
1

メタデータ自動更新機能付きデータカタログのソースコードを公開しました!

Last updated at Posted at 2024-03-28

前置き

こんにちは。データエンジニアの山口歩夢です!

先日、以下のイベントで登壇をしました!
こちらの記事では、登壇スライドとソースコードの共有させていただきます。

登壇の内容

StreamlitとTerraformでメタデータの自動更新機能付きのデータカタログを自作したことについてお話をしました!

機能について

どんな機能のデータカタログなのかをご説明させて頂きます!

データカタログの機能

ドロップダウンで検索

データベース、スキーマ、テーブルをドロップダウンで検索すると、
image.png
以下のように、テーブルの概要が表示されます。
image.png
カラムの概要やプレビューも表示されます。
image.png

テキストボックスで検索

テキストボックスに文字列を入力してエンターを押すと、
image.png
テーブルの概要に検索がかけられます。
image.png

ちなみにカラムやテーブルの概要は、SnowflakeのCOMMENTを表示させております!

メタデータ自動更新の機能

TerraformとGitHub Actionsを使って、メタデータの管理や自動更新をする機能を実装しました!
詳細は別の記事に書いてありますので、こちらをご覧ください。

スライドも公開!

上記に書いた内容ですが、詳細に記載したスライドを公開しております。
実装方法もスライドに書いてありますので、是非ご覧ください!

サンプルコード

ソースコードの公開もさせていただいております🫡
$ git cloneをして、環境構築をすることで簡単にご導入いただけるようにさせて頂きました!
環境構築の方法もREADMEに記載しております。

まとめ

まず、この度は登壇にお誘いいただき、誠にありがとうございました:bow:

以前からデータカタログを自作していたのですが、メタデータの管理に課題がありました。
TerraformとGitHub Actionsを使って、メタデータ管理が効率化されたので非常に良かったと思っております。

採用

GENDAデータチームではプロダクトのデータ解析や機械学習プロジェクトを推進できるデータサイエンティストを募集しています。
興味を持っていただけましたら、是非ご連絡いただけると幸いです!

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1