アラートを3分間集約してほしい

アラートが連続で発生した際などに、まとめてアラートを知らせてほしい場合の具体例を記載します。

今回は、180 秒間に連続してアラートが発生した場合、初報以外のアラートを関連メッセージとして扱い、アクションを一度だけ発生させます。

設定のポイント

トリガーの作成時に関連メッセージを設定することで、アラートを集約します。

  • 実行条件の設定で以下の 2 つを設定

    • 「イベントのフィールドを指定値と比較する」:「変化前の深刻度」が 0「と等しい」値である
    • 「一定時間経過後の指定した名前を持つ深刻度の値を指定値と比較する」:180 秒経過後、深刻度 指定した深刻度名任意の深刻度の値「以上の」値である

    ※「深刻度が 0 から変化し、3 分後の深刻度が指定した数値より高い場合」にアクションを実行するよう指定しています

  • 関連メッセージで以下の 2 つを設定

    • 「深刻度の増減を判定する」:深刻度が「増えた」
    • 「イベントの深刻度名を起点のイベントの深刻度名と比較する」:深刻度名が起点イベントの深刻度名「と等しい」

    ※「同様のイベントの深刻度名で深刻度が増えた場合」に関連メッセージとして集約するよう指定しています

関連メッセージは、「XX 秒経過後」のように秒数指定を実行条件で設定していないと設定できないため、注意してください。

受信スロットの作成

受信スロットを作成します。

画面横のメニューから「受信スロット」をクリックし、画面右上の「+」ボタンをクリックします。

ダイアログが表示されるため、以下の通り入力します。

  1. Webhook を選択します
  2. 任意の表示名を入力します
  3. 保存をクリックします

受信スロットが作成され、一覧に表示されます。

表示名をクリックして受信スロットの詳細画面に遷移し、監視システムと連携するための URL を取得します。

スコープの作成

スコープを作成します。

画面横のメニューから「スコープ」をクリックし、画面右上の「+」ボタンをクリックします。

ダイアログが表示されるため、以下の通り入力します。

  1. 任意の表示名を入力します
  2. 警戒判定閾値に任意の数値を設定します
  3. 障害判定閾値に任意の数値を設定します
  4. 必要に応じて「深刻度自動復旧の有効化」にチェックを入れ、復旧時間を指定します
  5. 保存をクリックします

ルールの作成

ルールを作成します。

画面横のメニューから「ルール」をクリックし、画面右上の「+」ボタンをクリックします。

ダイアログが表示されるため、以下の通り入力します。

  1. 任意の表示名を入力します
  2. 最初に作成した受信スロットを選択します

イベントの設定

「イベント(対象スコープを直接指定)」の「+」をクリックします。

ダイアログが表示されるため、以下の通り入力します。

  1. 「直接指定」を選択します
  2. 作成したスコープを選択します
  3. 作成ボタンをクリックします

イベントの編集画面が表示されるため、以下の通り入力します。

  1. 任意の深刻度名を入力します
  2. 5 と入力します
  3. プルダウンより「増やす」を選択します

最後に、ルール作成画面を一番下までスクロールし保存ボタンをクリックします。

アクションの作成

アクションを作成します。

画面横のメニューから「アクション」をクリックし、画面右上の「メール」ボタンをクリックします。

ダイアログが表示されるため、以下の通り入力します。

  1. 任意の表示名を入力します
  2. メール送信先の名前とメールアドレスを入力します
  3. 送信するメールの件名を入力します
  4. 送信するメールの本文を入力します
  5. 保存ボタンをクリックします

通知内容の設定については、Kompira AlertHub 基本マニュアル > 設定の流れ > アクションの作成 > 通知内容の設定 を参照してください。

トリガーの作成

トリガーを作成します。

画面横のメニューから「スコープ」をクリックし、スコープの作成 で作成したスコープをクリックします。

スコープの詳細画面に遷移するため、「トリガー」タブをクリックし、画面右端の「+」をクリックします。

ダイアログが表示されるため、任意の表示名を入力します。

実行条件の設定

「実行条件」の「+」をクリックします。

ダイアログが表示されるため、「イベントのフィールドを指定値と比較する」を選択し、作成ボタンをクリックします。

実行条件の編集画面が表示されるため、以下の通り入力します1

  1. プルダウンより、「変化前の深刻度」を選択します
  2. 0 と入力します
  3. プルダウンより、「と等しい」を選択します

続いて、再度「実行条件」の「+」をクリックします。

「一定時間経過後の指定した名前を持つ深刻度の値を指定値と比較する」を選択し、作成ボタンをクリックします。

実行条件の編集画面が表示されるため、以下の通り入力します1

  1. 180 と入力します
  2. イベントの設定 で設定した深刻度名を入力します
  3. 5 と入力します
  4. プルダウンより、「以上の」を選択します

関連メッセージの設定

「関連メッセージ」の「有効化」にチェックを入れ、「+」をクリックします。

ダイアログが表示されるため、「深刻度の増減を判定する」を選択し、作成ボタンをクリックします。

関連メッセージの編集画面が表示されるため、プルダウンより「増えた」を選択します2

続いて、再度「関連メッセージ」の「+」をクリックします。

ダイアログが表示されるため、「イベントの深刻度名を起点イベントの深刻度名と比較する」を選択し、作成ボタンをクリックします。

関連メッセージの編集画面が表示されるため、プルダウンより「と等しい」を選択します2


最後に、「実行」にて アクションの作成 で作成したアクションを選択し、保存ボタンをクリックします。

以上で、AlertHub 上の設定は終了です。

動作確認

動作確認を行います。

実際にアラートを複数件送信してみると、以下の通りイベントが 3 回発生し深刻度が 15 となっていますが、アクションは 1 回のみ発生していることが分かります。

メールを確認してみると、初報分のみアクションを送信し、関連メッセージもカウントされていることが確認できました。

1

深刻度が 0 から変化し 180 秒経過した時点でイベントの設定 で設定した深刻度の値が警戒閾値の 5 を超えている場合にアクションが発生する設定です。
関連メッセージは、「XX 秒経過後」のように秒数指定を実行条件で設定していないと設定できないため、注意してください。

2

関連メッセージに含むイベントとして、深刻度を増加させた上で、初報のアラートにより発生したイベントと同じ深刻度名のイベントを指定する設定です。