Deis や Deis Workflow の運用中やアップグレード時に,ビルダが activating/start-post
のままになることがあります。
いくつか可能性はあるかとは思いますが,忍耐強く待つことで復旧される可能性があります。
復旧されるケース
Postgres が起動していない場合は,時間はかかるものの,復旧する可能性が高いです。
なんで時間がかかるのか?
現時点まで(v2.12.0)の Deis では、v1 系も v2 (Workflow と呼ばれる)も Postgres のクラスタリングをサポートしていません。しかし、Deis そのものはクラスタでの実行が前提で,どのノードでも Postgres を立ち上げられるようにしてあります。
Deis では,Postgres を実行しているノードが落ちてもデータが保全されるよう,Postgers コンテナには WAL-Eが含まれ,データベースのスナップショットを永続ストレージに保存できるようになっています1。
(WAL-E の具体的な動作は、こちらが参考になります。)
運用時のリブートやアップグレードでデータベースを担っているノードが落ちた場合には、別のノードで同サービスが起動します。
その際に、WAL-E を使って永続ストレージにある WAL データデータベースを再構築します。
ネットワークを介しますし、スナップショットの各ファイルは LZO 圧縮されているので展開のコストもあります。
よって、それなりの時間がかかります。
-
S3, GCS, AzureBlob などのサポートがあります。 ↩