後で整理するかもするし、しないかもしれない。
インストール時
万人が引っかかりっそうなチェックポイント。
Rook/Ceph わかってないやつのメモなので、直ちに信じてはいけない。自己責任。
Helm でのデプロイ
-
image.tag
を明示したほうが良い。- デフォルトは master で、後述する問題の遠因になりうる。
-
csi.enableCSIHostNetwork
の設定をチェックする。 -
csi.provisionerPriorityClassName
は高めの値で設定したほうが安全。-
addon-priority
とかhigh-priority
とか。
-
-
csi.pluginPriorityClassName
agent.priorityClassName
discover.priorityClassName
も同様。 -
agent.flexVolumeDirPath
は公式に説明がある。必要に応じて設定しないと動かない(かもしれない)。
CephCluster CRD
-
spec.cephVersion.image
は、想定しない(古い)バージョンのイメージを operator へ与えると、reconcile されない。適切に設定する必要がある。(Helm で「image.tag
を明示したほうが良い」としたのは、これに掛かってくる) -
priorityClassNames.all
設定を行ったほうが安全。そして複数形であることに注意。 -
spec.network.hostNetworks
は必要ならtrue
。 -
spec.storage.storageClassDeviceSets[].portable
は managed クラスタなど PVC-Based を選択できるとき、更にいうとノードのオートスケールを考えている場合は、true
を強く推奨。
運用
- Ceph が WARN (もしくは更に悪い)状態である場合、CephCluster CRD を変更しても、 operator は reconcile を行わない。
- よって何かがおかしいときは Ceph クラスタを安定させる方を優先する。
- Ceph 層の運用、特に障害対応では toolbox コンテナを使う。