rabbitmq コンテナが再起動を繰り返す
クラスタ構成
様々な理由で rabbitmq が再起動を繰り返して、正常に動作できなくなる場合があります。
ブラウザで画面アクセスすると以下のようにエンジンとジョブマネージャが共に停止しているエラーが表示される場合があります。
この場合は、以下のいずれであると考えられます。
- rabbitmq が正常に動作できていないために、両コンテナがともに正常に起動できなくなっている
- rabbitmq は正常に動作しているが、kengine コンテナと jobmngrd コンテナがそれぞれに問題があって両方とも停止している
こうしたときは、kengine や jobmngrd が依存している rabbitmq が正常に動作しているかを先に確認してみてください。
rabbitmq に何らかの問題が生じていないかについては、以下を参考に調査してみてください。
- RabbitMQ の Mnesia データベースが破損している
- Rabbitmq ログに「Partial partition detected」というエラーが記録されている
- Rabbitmq ログに「Waiting for Mnesia tables」というエラーが記録されている
- Rabbitmq ログに「erl_crash」というエラーが記録されている
- Rabbitmq ログに「leader saw pre_vote_rpc for unknown peer」という警告が記録されている
rabbitmq が正常に動作しているようであれば、kengine コンテナや jobmngrd コンテナに異状が生じていないかを確認するようにしてみてください。