インシデント対応・SLA
AnimaTimeのSLA目標、インシデント対応プロセス、エスカレーション方針について説明します。
SLA目標
AnimaTimeは月間稼働率 99.9% を目標としています(計画メンテナンスを除く)。
インシデント重大度レベル
| レベル | 定義 | 初動対応 | 解決目標 |
|---|---|---|---|
| P1 — 緊急 | サービス全体が利用不能 | 15分以内 | 4時間以内 |
| P2 — 重大 | 主要機能の一部が利用不能 | 1時間以内 | 8時間以内 |
| P3 — 軽微 | 一部機能の劣化、回避策あり | 4時間以内 | 3営業日以内 |
エスカレーション
重大なインシデントは、監視システムのアラートにより運用チームへ通知されます。 オンコール体制と段階的エスカレーションのプロセスは現在整備を進めています。
コミュニケーション
インシデント発生中は以下のチャネルで状況を共有します。
- ●ステータスページ(/status)での稼働状況の掲載
- ●影響を受けるお客様へのメール通知
ポストモーテム
重大なインシデントの解決後は、原因分析・影響範囲・再発防止策をまとめたポストモーテム(事後分析)の作成・共有に努めます。