このシリーズ
- Apache Zeppelinでデータ分析を分散処理する - Part 1: データ分析のライフサイクル
- Apache Zeppelinでデータ分析を分散処理する - Part 2: Ambari on DockerにZeppelinをセットアップする
- Apache Zeppelinでデータ分析を分散処理する - Part 3: ZeppelinでHiveを使えるようにする
- Apache Zeppelinでデータ分析を分散処理する - Part 4: Ambari on Dockerのambari-functionsを使ってみる
Hiveがエラーになる
前回セットアップしたデフォルトのZeppelinはHiveの実行に失敗してしまいます。サンプルの Australian Dataset (Hive example)のエラーです。
認証エラーです。Hortonworksのフォーラムを見るとちょうどError while running hive queries from Zeppelin on HDP 2.3.2と言うスレッドがあります。結論は出ていないのですが、hadoop.proxyuser.hive.groups = *
とすると良いみたいです。
Ambariの設定
AmbariからHDFSの設定を変更します。Advancedタブから
Custom core-site
のhadoop.proxyuser.hive.groups
をusers
から*
に変更します。
コメントを入力してSaveします。
HDFSの変更後にリスタートします。その他のアラートが出ているコンポーネントがあればリスタートします。
Australian Dataset (Hive example)を再度実行する
もう一度Australian Dataset (Hive example)を実行します。drop table if exists health_table
が成功しました。
続いてその下のhiveクエリーも正常に実行できるようになります。