インシデント管理

いんしでんとかんり

障害対応の流れと役割を整える運用。

  • #incident
  • #operations

障害検知→初動対応→指揮官・記録係などの役割割り振り→復旧→ポストモーテム→改善まで、混乱しがちな障害対応を標準化する仕組み。コミュニケーション・意思決定の質が復旧時間を左右する。