この記事について
Cloudera のデータ可視化機能である Data Viz が、オンプレミスの Base の機能の一部として使えるようになりました。
2025年6月現在では、Data Viz に対応する Base のバージョン(7.1.9, 7.3.1)をインストールしただけでは Data Viz が使えるようにはならず、追加の手順が必要になります。
追加の手順は以下のドキュメントに記載されています。
この記事には、⬆️のドキュメントの翻訳と、必要に応じて補足情報を記載します。
すべてを記載すると長大になるため、この記事ではインストールの手順を紹介します。
前提条件
- Data Viz を利用可能な Cloudera の Base のバージョンがインストール済みであること
- 対応バージョンは Cloudera のサポートマトリクスで確認
- Cloudera Manager がインストールされているサーバーに root 権限でアクセスできること(sudo できること)
- メタデータのストレージとして利用可能なRDBMSに接続できること(MySQL, Postgres など)
(ドキュメントより)リソース競合を避けるため、Data Viz 用に新たなノードを立てることを推奨します。特に、既存のクラスタのワークロードの高いノードと同居させることはおすすめしません。
(補足)メタデータ用のストレージについて、手元で検証した際はHMSと同じRDBMS(Postgres)に DataViz用のデータベースを作成しました。
(補足)一部の手順は Cloudera Manager の再起動を伴います。稼働中のクラスタに DataViz を追加する場合は、停止が可能な時間帯に行うことをおすすめします。
インストール手順
DataViz用のレポジトリを Cloudera Manager に追加する
-
Cloudera Manager にログインします
-
トップ画面からの左のメニューから ホスト > Parcel を選択します
-
DataViz の parcel が入ったレポジトリ (
https://archive.cloudera.com/p/cdv/{バージョン名}/parcels/
など)を設定し「Save & Verify Configuration」をクリックします
Data Viz の CSD ファイルをダウンロード・追加する
この手順について
Cloudera Manager が新たなサービスを認識し管理できるように、以下の手順で Custom Service Descriptor (CSD) ファイルを追加する必要があります。
Cloudera Manager のホストで root になれる、もしくは sudo できる必要があります。
(補足)この手順の最後に Cloudera Manager の再起動を行います。
手順
- Cloudera Manager のホストに ssh で入ります
/opt/cloudera/csd
ディレクトリに入る
-
/opt/cloudera/csd
ディレクトリが存在することを確認します
ls -lA /opt/cloudera/csd
-
/opt/cloudera/csd
ディレクトリが存在しない場合は作成します
mkdir /opt/cloudera/csd
-
/opt/cloudera/csd
ディレクトリに入ります
cd /opt/cloudera/csd
CSDファイルのダウンロード
DataViz の CSDファイルをダウンロードします
sudo wget https://{レポジトリアクセス用のユーザー}:{レポジトリアクセス用のパスワード}@{ダウンロード元}/{jarファイル名}.jar
具体的には以下のようになります。
sudo wget https://xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx:yyyyyyyyyyyy@archive.cloudera.com/p/cdv/8.0.4/redhat8/yum/DATAVIZ-8.0.4-b47.p1.67141340.jar
完了後、 ls -lA
などを実行し、意図した jar ファイルがダウンロードされていることを確認します。
Cloudera Manager サービスの再起動
設定を反映させるために、まずはホスト上で Cloudera Manager のサーバーを再起動します。
sudo service cloudera-scm-server restart
完了後、Cloudera Manager の画面にログインし、 Cloudera Management Service の再起動を行います。
ホーム画面から、 Cloudera Management Service の右の三点をクリックし「再起動」をクリックします。
以下のプロンプトが表示されたら、「再起動」をクリックします。
Data Viz サービスの追加
ここまでの手順が完了すると、他のサービス(Hive や Impala など)を入れるときと同じように、Cloudera Manager 上に Data Viz のサービスが表示されて追加できるようになります。
手順
-
Cloudera Manager のホーム画面で、該当のクラスタの右の三点をクリックし「サービスの追加」をクリックします
-
ホーム画面で、 Cloudera Management Service の右の三点をクリックし「再起動」をクリックします
ここまでの手順が完了すると、クラスタ配下のサービスの一覧にDatavizが表示されるようになります。
Dataviz を選択すると、以下のような Dataviz の管理画面を開くことができます。
このあとに続く手順(初回ログイン、コネクションの作成)は、以下のページで解説しています