0. はじめに
この記事は BrainPad Advent Calender 2023 15日目の記事です。
はじめまして。
株式会社ブレインパッド アプリケーション開発ユニットの @atsushi_takamiya と @satoshi-goto です。
本記事は、新卒でBPにASEとして入社1・2年目の2人で開発したアプリの環境構築と概要についてまとめた記事になります。
1. 概要
本記事で紹介するDokkuを利用したDash民主化アプリは、個人開発者が手軽にDashダッシュボードにアプリを乗せ、社内で公開することを可能にします。このアプリでは、Dockerfileを使用せず、シンプルなプッシュ操作だけでアプリを社内公開できるため、開発者は手間をかけずに自身のDashアプリを社内で共有できます。
BPからDashを用いた新サービス「FAST」が登場しました。これに伴い、社内のデータサイエンティストにDashの利用を促進する取り組みの一つとしてDash民主化アプリを作製しました。このアプリは、個人開発者が作成したDashアプリを社内で手軽に公開するためのニーズに応えることを目指しています。
将来的に、Dash民主化アプリは重要な役割を果たし、まず新卒研修においては、アプリを活用して新入社員にDASHの効果的な利用方法を教育することが期待されます。同時に、アプリを通じて技術共有を推進し、社内での円滑な情報共有を促進することで、同僚やチームメンバーがアイディアやデータをより簡単かつ効果的に共有できる環境が整備されるでしょう!
2. 使用した技術
次に、DASH民主化アプリの主要技術について解説します。
図1はDASH民主化アプリの構造です。
DASH民主化アプリは、ユーザーが画面上で操作(Dokkuアプリの作成など)をすると、FastAPIがVMホスト上でDokkuコマンドを実行し、Dokkuアプリの管理ができる構造になっています。
- Dash
- DashはPythonのウェブアプリケーションフレームワークで、PlotlyやFlaskを基にした直感的な構文で、データ可視化やダッシュボードを簡単かつ迅速に作成できます。
参考: Dash Documentation & User Guide | Plotly - Dash民主化アプリも、Dashを利用して登録されたアプリの一覧・アクセスできるダッシュボードの作成を行いました。
参考: dash-app-gallery | GitHub
- DashはPythonのウェブアプリケーションフレームワークで、PlotlyやFlaskを基にした直感的な構文で、データ可視化やダッシュボードを簡単かつ迅速に作成できます。
- FastAPI
- FastAPIは、Pythonのモダンかつ高性能なAPI開発フレームワークであり、型ヒントと自動生成されるAPIドキュメントにより迅速な開発と高い可読性を提供します。async/await構文をサポートし、高速な実行性能と豊富な機能セットを備えています。
参考: FastAPI - Dash民主化アプリからdokkuの操作を行うために利用しています。詳細は、後の環境構築を参照。
参考: DokkuAPI | GitHub
- FastAPIは、Pythonのモダンかつ高性能なAPI開発フレームワークであり、型ヒントと自動生成されるAPIドキュメントにより迅速な開発と高い可読性を提供します。async/await構文をサポートし、高速な実行性能と豊富な機能セットを備えています。
- Dokku
- Dokkuは、Heroku風のプラットフォームを提供するオープンソースのPaaS(Platform as a Service)ツールです。Dokkuを使用すると、簡単かつ迅速に自己ホスト型のクラウドプラットフォームをセットアップでき、さまざまなアプリケーションやサービスをデプロイすることができます。 Gitを利用してコードのデプロイを行うことができ、専門的なインフラストラクチャの知識が不要な点が特徴です。
参考: Dokku - The smallest PaaS implementation you've ever seen - Dash民主化アプリは、軽量さとシンプルな使い易さが求められていたため、アプリの登録・管理にDokkuを利用しています。
- Dokkuは、Heroku風のプラットフォームを提供するオープンソースのPaaS(Platform as a Service)ツールです。Dokkuを使用すると、簡単かつ迅速に自己ホスト型のクラウドプラットフォームをセットアップでき、さまざまなアプリケーションやサービスをデプロイすることができます。 Gitを利用してコードのデプロイを行うことができ、専門的なインフラストラクチャの知識が不要な点が特徴です。
3. アーキテクチャ
図2はDASH民主化アプリのアーキテクチャを表しています。
以下の手順でDokkuアプリを作成するリクエストを処理します。
- アプリ登録
ユーザーが画面上でアプリを登録すると、DashアプリがFastAPIにDokkuアプリを作成するリクエストを送信します。
- リクエスト
FastAPIがDashアプリからリクエストを受信すると、VMホスト上でDokkuアプリを作成するDokkuコマンドを実行します。
- アプリ作成
VMホスト上でDokkuアプリを作成するDokkuコマンドを実行され、Dokkuアプリが作成されます。
- ソースコードのpush
ユーザーがDokkuアプリのリポジトリにソースコードをpushし、アプリが起動します。
4. 環境構築
GCPのCompute Engineを使用して環境を構築します。
Dash民主化アプリでは、Compute EngineのVMインスタンス上にDokku環境を構築しています。
Compute Engineの設定
- VMインスタンスの立ち上げ
GCPコンソール画面からVMインスタンスを立ち上げます。
参考: VMインスタンスの作成と開始 | Compute Engine のドキュメント | Google Cloud
- IPアドレスの設定
DNSの設定で使用するIPアドレスを発行します。
参考: 静的外部 IP アドレスの予約 | Compute Engine のドキュメント | Google Cloud
- DNSの設定
Cloud DNSを使用してドメインを取得します。
参考: Cloud DNS を使用してドメイン名の DNS レコードを設定する | Cloud DNS のドキュメント | Google Cloud
Dokkuのインストール
- Dokkuの初期設定
以下のコマンドを実行して先ほどCloud DNSで取得したドメインを設定します。dokku domains:set-global {ドメイン名}
- APIキーの作成
バックエンド(FastAPI)でDokkuコマンドを実行するので、APIキーを作成します。
参考: APIキーを作成する | ドキュメント | Google Cloud
cronの設定
コンテナをビルドした時に、コンテナイメージが/var/lib/docker/overlay2/
以下にイメージレイヤー単位で保存されます。dokkuアプリにソースコードをpushした時やvmインスタンスを起動した時などに/var/lib/docker/overlay2/
以下に不要なコンテナイメージが蓄積してしまいます。
cronで不要なキャッシュを削除するスクリプトを定期実行することでこの問題を解決できます。
- script.shの作成
使用していないコンテナのキャッシュを削除するコマンドを記載します。script.sh/usr/bin/docker system prune -a --force
- cronジョブの設定
crontab -e
でcronの設定をします。タスクを実行するタイミングを以下の5項目(数字)で設定します。crontab -e
*
は全ての範囲を表します。
以下の例は、毎日8:00にscript.sh
を実行するように設定しています。- 分: 0 ~ 59
- 時: 0 ~ 23
- 日: 1 ~ 31
- 月: 1 ~ 12
- 曜日: 0 ~ 7
# 分 時 日 月 曜日 0 8 * * * bash script.sh
- タスク一覧の表示
設定したcronジョブを確認することができます。crontab -l
ディレクトリマッピングの設定
アプリの登録内容を保存するために、VMホスト上の永続ディレクトリをマウントします。
参考: Persistent Storage - Dokku Documentation
-
var
ディレクトリのマウント
以下のコマンドを実行して永続ディレクトリvar
をマウントします。dokku storage:mount {アプリ名}
- マウント先一覧の表示
以下のコマンドを実行してマウント先を確認できます。storage:report {アプリ名}
Dokkuアプリの管理(DASH民主化アプリの作成)
以下の手順で、画面上でDokkuアプリを管理することができます。
- DokkuコマンドAPIの作成
VMホスト上でDokkuコマンドを実行するためにFastAPIでDokkuコマンドAPIを作成します。DashアプリでDokkuコマンドを使用できるようになります。
参考: DokkuAPI | GitHub
- Dokkuアプリの作成
DashアプリとFastAPI用にそれぞれDokkuアプリを作成します。
参考: アプリケーション管理 | Dokku のドキュメント# Dokkuアプリの作成 dokku apps:create {Dokkuアプリ名}
- それぞれのDokkuアプリにソースコードをpushする
ローカルにDokkuアプリのリポジトリを追加してソースコードをpushします。# リポジトリの追加 git remote add dokku dokku@{Dokkuサーバー}:{Dokkuアプリ名} # ソースコードのpush git push dokku
5. デモンストレーション
DASH民主化アプリにsample-app
という名前でアプリを作成してみます。
(※プライバシーの問題で画像の一部を隠しています。)
-
アプリの登録
ユーザーは画面上で必要な項目を入力してアプリの登録を行います。 -
ソースコードのpush
アプリを登録した後、ローカルからDokkuアプリのリポジトリにソースコードをpushします。# リポジトリの追加 git remote add dokku dokku@{Dokkuサーバー}:sample-app # ソースコードのpush git push dokku
-
アプリの閲覧
DASH民主化アプリから登録したアプリを閲覧します。
無事、ソースコードをpushでき、アプリが起動していることを確認できました🎉
6. おまけ
Artifact Registoryの設定
GCPのArtifact Registoryを使用してPythonパッケージの管理する方法です。有償のパッケージなどをセキュアに管理することができます。
- 認証情報を設定する(推奨: キーリングを使用した認証)
Artifact Registoryを使用するために、まずは認証情報の設定をします。GCPのドキュメントでは、キーリングを使用した認証が推奨されています。
参考: Python パッケージ リポジトリに対する認証の設定 | Artifact Registry のドキュメント | Google Cloud
- Artifact Registoryにリポジトリを作成する
Pythonパッケージを保存するリポジトリを作成します。
参考: 標準リポジトリを作成する | Artifact Registry のドキュメント | Google Cloud
- ローカルPCからPythonパッケージをアップロードする(例: twine)
ローカルPCのPythonパッケージをArtifact Registoryにアップロードする。python3 -m twine upload --repository-url {リポジトリのURL} {ファイルのパス}
- requirements.txtの書き方
Artifact Registoryから優先的にPythonパッケージを使用するようにする。
{key}
にはサービスアカウントのjsonキーをダウンロードして、base64コマンドでエンコードしたものを入力する。
参考: Python パッケージ リポジトリに対する認証の設定 | Artifact Registry のドキュメント | Google Cloudindex.txt--index-url {key} --extra-index-url https://pypi.python.org/simple
requirement.txt-r index-url.txt {pythonパッケージ} == {バージョン} ...
7. おわりに
社内では、データサイエンティストの方々が続々とdashアプリを登録してくださっています。
まだまだ課題は山積みですが、より多くの方々に使っていただけるよう尽力していきます!
ここまで読んでいただきありがとうございました!
8. 参考
新サービス「FAST」
Dash Documentation & User Guide | Plotly
dash-app-gallery | GitHub
FastAPI
DokkuAPI | GitHub
Dokku - The smallest PaaS implementation you've ever seen
VMインスタンスの作成と開始 | Compute Engine のドキュメント | Google Cloud
静的外部 IP アドレスの予約 | Compute Engine のドキュメント | Google Cloud
Cloud DNS を使用してドメイン名の DNS レコードを設定する | Cloud DNS のドキュメント | Google Cloud
APIキーを作成する | ドキュメント | Google Cloud
Python パッケージ リポジトリに対する認証の設定 | Artifact Registry のドキュメント | Google Cloud
標準リポジトリを作成する | Artifact Registry のドキュメント | Google Cloud
Python パッケージ リポジトリに対する認証の設定 | Artifact Registry のドキュメント | Google Cloud
アプリケーション管理 | Dokku のドキュメント
Persistent Storage - Dokku Documentation