ドキュメントIT管理者ガイドインシデント対応・SLA

インシデント対応・SLA

AnimaTimeのSLA目標、インシデント対応プロセス、エスカレーション方針について説明します。

SLA目標

AnimaTimeは月間稼働率 99.9% を目標としています(計画メンテナンスを除く)。

インシデント重大度レベル

レベル定義初動対応解決目標
P1 — 緊急サービス全体が利用不能15分以内4時間以内
P2 — 重大主要機能の一部が利用不能1時間以内8時間以内
P3 — 軽微一部機能の劣化、回避策あり4時間以内3営業日以内

エスカレーション

重大なインシデントは、監視システムのアラートにより運用チームへ通知されます。 オンコール体制と段階的エスカレーションのプロセスは現在整備を進めています。

コミュニケーション

インシデント発生中は以下のチャネルで状況を共有します。

  • ステータスページ(/status)での稼働状況の掲載
  • 影響を受けるお客様へのメール通知

ポストモーテム

重大なインシデントの解決後は、原因分析・影響範囲・再発防止策をまとめたポストモーテム(事後分析)の作成・共有に努めます。