Cloudera Manager Advent Calendar 2015の17日目です。
今日は、月次で開催しているCloudera Manager(以下CM)勉強会でした。20名以上の参加者の半数以上が既にCM利用中で、質疑応答も活発だったので、Q&Aという形で公開したいと思います。
Q. 期待したバージョンのParcelが表示されない
A. Parcelのロケーションをバージョン固定で設定していると、そのバージョンしか認識されません。たとえばhttp://archive.cloudera.com/cdh5/parcels/5.4.2
と設定していれば、CDH 5.4.2のParcelしか表示されません。一方、https://archive.cloudera.com/cdh5/parcels/{latest_supported}/
と設定していれば、常に最新版のCDHのParcelが表示されます。デフォルトではこの値になっています。
また、CMの(マイナー)バージョンは常にCDHより上位とする必要があるので注意してください。
参考: Product Compatibility Matrix for CDH and Cloudera Manager
http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/topics/pcm_cdh_cm.html
Q. AlertPublisherで、テストメールが送信できない
A. 手元の環境で試したところ、AlertPublisherが動作するホストでpostfixが起動していないケースでメールが飛ばないという事象が確認できました。この場合、AlertPublisherのログに以下の例外が出力されます。
2015-12-01 16:48:01,108 ERROR org.apache.camel.processor.DefaultErrorHandler: Failed delivery for exchangeId: ID-c5-demo-dev-44136-1448953081553-0-20. Exhausted after delivery attempt: 1 caught: org
.springframework.mail.MailSendException: Mail server connection failed; nested exception is javax.mail.MessagingException: Could not connect to SMTP host: localhost, port: 25;
AlertPublisherが動作するホストでメールサーバ(postfixなど)がポート25で起動していることを確認してください。また、mailコマンドなどでそもそもメールの送信が可能かどうかも同時に確認してください。
参考: Configuring Alert Email Delivery
http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/topics/cm_ag_email.html
Q. ジョブの実行状況残り処理量を見ることはできるか
A. YARNアプリケーションページから進行状況を確認することが可能です(多少のタイムラグはあります)。SparkStreamingの処理には未対応です。
参考: Monitoring YARN Applications
http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/topics/cm_dg_yarn_applications.html
Q. ホストを追加するときにOSの言語を英語にしないと処理が進まないという問題がある
A. 現行のCMは、少なくともインストール時のセッションは英語である必要があります
参考: Cloudera Manager環境での言語設定について
https://groups.google.com/a/cloudera.org/d/topic/cdh-user-jp/NTYbCY0u1xk/discussion
Q. ジョブの実行中に、SLAに応じて自動的にノード追加するような機能はあるか
A. CMにそのような機能はありません
Q. ディスク故障が発生している場合に、Cloudera Managerで検知する機能はあるか
A. CM自身にはありませんが、DataNodeレベルではdfs.datanode.failed.volumes.tolerated
にて障害を許容できるディスク本数を指定できます。CMでクラスタを構築すると、マウントされているディスク数の半数まで許容するよう設定します。
参考: Autoconfiguration
http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/topics/cm_mc_autoconfig.html
dfs.datanode.failed.volumes.tolerated - For each DataNode, set to (number of mountpoints on DataNode host) / 2.
Q. Cloudera Manager自体のHA機能はあるか
A. ロードバランサを使用してHAを構築することになります
参考: Configuring Cloudera Manager for High Availability With a Load Balancer
http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/topics/admin_cm_ha_overview.html
Q. 設定情報はすべてデータベースに入るか
A. CM自身の設定(どのデータベースを参照するか、など)以外は、すべてデータベースに保存されます
Q. 設定情報は/etc配下に保存されるのか
A. CMではサービス設定とクライアント設定という考え方で設定ファイルを管理しています。詳しくは以下をご覧ください
参考: Cloudera Managerが管理する設定ファイルの違いについて
http://qiita.com/d1ce_/items/15b9e7cb58ff2289f3cb