後で整理するかもするし、しないかもしれない。
インストール時
万人が引っかかりっそうなチェックポイント。
Rook/Ceph わかってないやつのメモなので、直ちに信じてはいけない。自己責任。
Helm でのデプロイ
-
image.tagを明示したほうが良い。- デフォルトは master で、後述する問題の遠因になりうる。
-
csi.enableCSIHostNetworkの設定をチェックする。 -
csi.provisionerPriorityClassNameは高めの値で設定したほうが安全。-
addon-priorityとかhigh-priorityとか。
-
-
csi.pluginPriorityClassNameagent.priorityClassNamediscover.priorityClassNameも同様。 -
agent.flexVolumeDirPathは公式に説明がある。必要に応じて設定しないと動かない(かもしれない)。
CephCluster CRD
-
spec.cephVersion.imageは、想定しない(古い)バージョンのイメージを operator へ与えると、reconcile されない。適切に設定する必要がある。(Helm で「image.tagを明示したほうが良い」としたのは、これに掛かってくる) -
priorityClassNames.all設定を行ったほうが安全。そして複数形であることに注意。 -
spec.network.hostNetworksは必要ならtrue。 -
spec.storage.storageClassDeviceSets[].portableは managed クラスタなど PVC-Based を選択できるとき、更にいうとノードのオートスケールを考えている場合は、trueを強く推奨。
運用
- Ceph が WARN (もしくは更に悪い)状態である場合、CephCluster CRD を変更しても、 operator は reconcile を行わない。
- よって何かがおかしいときは Ceph クラスタを安定させる方を優先する。
- Ceph 層の運用、特に障害対応では toolbox コンテナを使う。