ジョブフローの動作確認による診断手順

DIAG-U3: ジョブフローを実行できるかの確認

ブラウザから以下のようなジョブフローを実行できるか、ジョブフローが成功するかを確認してください。

  • 基本的には常に成功するジョブフロー
  • リモートジョブを含まない ジョブフロー
  • 既存の Kompria オブジェクトに影響を与えないジョブフロー

もっとも単純には、次のようなジョブフローを用意して実行してみてください。

print('OK')

ジョブフローが実行できない場合

ジョブフローが実行できない場合はいくつかの要因が考えられますので、以下のような調査を実施してみてください。

  • ライセンスが有効であるか、また、期限内であるかを確認してください。
    • 適正なライセンスを更新してください。
  • 実行中プロセス数が制限を超えていないか確認してください。
    • 自動起動などですでにジョブフロープロセスが多数動作している状況であれば、ジョブフローの実行自体は出来ていることになりますので、次の診断に進んでください。
    • ただし、ジョブフロープロセスが多数動作していること自体が想定外であれば、ジョブフローの設計や実装に問題がある可能性があります。ジョブフロー実行に関する設計や実装に問題がないか確認してください。

上記に該当しない場合は、rabbitmq や kengine コンテナで障害が起きている可能性があります。

ジョブフローの実行はできるがジョブフローが異常終了する場合

この場合は、まずジョブフロー自体に問題がないか確認してください。

  • プロセスログを確認して想定外のエラーなどが記録されていないか確認してください。
  • ジョブフローの実装としてエラーになる状況になっていないか確認してください。

上記に該当しない場合は、rabbitmq, kengine コンテナのいずれかで障害が起きている可能性があります。

クラスタ構成場合は、以下に該当するか調査してみてください。

ジョブフローが正常終了する場合

この場合は、rabbitmq, kengine コンテナは正常に動作していると考えられます。

⇒ 次の診断に進んでください。

失敗する場合、または成否が安定しない場合

この場合は、rabbitmq, kengine コンテナのいずれかで障害が起きている可能性があります。

コンテナの診断手順を進んでください。

DIAG-U4: リモートジョブが実行できるかの確認

ブラウザから以下のようなリモートジョブを実行できるか、ジョブフローが成功するかを確認してください。

  • 基本的には常に成功するジョブフロー
  • リモートジョブを含む ジョブフロー
  • 既存の Kompria オブジェクトに影響を与えないジョブフロー

もっとも単純には、次のようなジョブフローを用意して実行してみてください。

['echo OK']

成功する場合

ジョブフローが正常終了する場合、

  • rabbitmq, kengine, jobmngrd コンテナは正常に動作していると考えられます。
    • ⇒ 次の診断に進んでください。

失敗する場合、または成否が安定しない場合