Site recoveryのレプリケーション正常性監視のアラート通知が遅い理由

2023年8月18日

質問

・ASRの正常性異常によりアラートを通知する試験を検証環境でしています。

・ASRの正常性異常を起こす方法としては、ASR対象のVMを停止させる手法をとっています。

・対象のVMを停止してから、20分程度、レプリケーションヘルスが正常の状態になっておりました。

  (Azure Portal上の、「レプリケートされたアイテム」で確認)

・また、VMを起動してから、レプリケーションヘルスの正常性が戻るまで、30分くらい時間がかかったようでした。

VMを停止してからレプリケーションヘルスが異常になるまでの時間や

VMを起動してからレプリケーションヘルスが正常になるまでの時間が

想定よりも長いと思ったのですが、これは想定されたものでしょうか。

(VM停止したら、本来ならすぐにレプリケーションヘルスは異常になるべきではないか思いました)

回答

恐れ入りますが、レプリケーション ヘルスの更新に要した時間については仕様動作となります。

特にレプリケーション ヘルスが正常へ戻る場合は、レプリケーション ヘルスの再計算や、復旧ポイントの取得等の時間が発生するため、時間を要します。

VM の起動停止によってレプリケーション ヘルスが即時 (数秒以内) に変更されませんので、ご了承下さい。

■ 弊社環境での確認結果

・ レプリケーション ヘルスが正常から警告へ遷移

    VM の停止(割り当て解除)

    ↓ 10 分後

    レプリケーション ヘルスが “警告"

・ レプリケーション ヘルスが警告から正常へ遷移

    VM の起動

    ↓ 2 分後

    VM 起動を検知

    ↓ 28 分後

    レプリケーション ヘルスが正常になる。