ユースケース

インシデント対応

オンコールの負担を軽減しましょう。適切なアラートを適切な担当者に適時に送信することで、チームのコラボレーションを強化して問題を解決できます。

activityhero

課題

オンコールの負担と混乱が不満と燃え尽き症候群を生む

オンコールチームは、ユーザーに影響が及ぶ前にインシデントを確認して解決しなければならないという大きなプレッシャーにさらされています。しかも今日ではサービスがかつてないほど複雑化し、コンテキストの把握が困難であるため、アラートの優先順位付け、ルーティング、解決が一層難しくなっています。これらの要因がインシデント対応担当者にさらなる負担をもたらし、ときには燃え尽き症候群を引き起こします。

解決策

Splunkでインシデントをすばやく解決

インシデント対応を自動化 インシデント対応を自動化

インシデント対応を自動化

適切な担当者に適切なアラートを届けることで、確認と解決にかかる時間を短縮

IT運用とDevOpsを強化 IT運用とDevOpsを強化

IT運用とDevOpsを強化

ITスタックやインシデントレポートを統合することで、包括的なChatOpsエクスペリエンスを実現

オンコールを手軽に オンコールを手軽に

オンコールを手軽に

モバイルでのオンコール対応を容易にして、担当者の負担を軽減

protect

オンコールスケジューリングをシンプルに

オンコールスケジュールを効率化し、エスカレーションポリシーを効果的に管理できます。また、ローテーションから優先度の変更まで、インシデント管理のあらゆる基本作業を自動化できます。

Splunk On-Call は、私がこれまで経験した中で最も持続可能なオンコールスケジュールです。

Bethany Ross Abbott氏、 NS1社、Technical Operations Manager

インシデントの自動エスカレーション

エスカレーションポリシー、対応者の提案、チームビュー、ウォールーム(作戦司令室)のセットアップを自動化して、問題をすばやく解決する体制を整備できます。

apm-dashboard-featured
rba

モバイルでのコラボレーション

iOSとAndroidのネイティブアプリケーションを使用して、メタデータが豊富に含まれる通知をデバイスで直接受信できるので、デスクトップPCの前にいる必要はありません。対応、解決、再ルーティング、さらにはアラートのスヌーズまで、すべてをアプリケーション内で直接実行できます。

99 Percent Image Graphic

平均確認時間(MTTA)の短縮率

— PSCU社お客様事例

製品

IT運用とDevOpsのための強力で拡張性に優れた機能

アラートの発生から通知までの時間を短縮し、継続的に改善できる環境を構築できます。また、柔軟性を高めることによってオンコールのウェルビーイングを向上させることもできます。

関連ユースケース

包括的なデータプラットフォームで組織のニーズに対応

AIOps AIOps

AIOps

機械学習を活用したアラートとアノマリ検出により、顧客に影響が及ぶ前にインシデントを防止

詳細はこちら
クラウド監視 クラウド監視

クラウド監視

リアルタイムのメトリクス監視とアラートにより、テクノロジースタックを横断してすべてのクラウドとサービスを完全忠実に可視化

詳細はこちら
SLI/SLOの監視 SLI/SLOの監視

SLI/SLOの監視

KPI主導型の監視とダッシュボードでの最新情報の表示により、ビジネスクリティカルなすべてのサービスをあらゆる角度から可視化

詳細はこちら

インテグレーション

スタックとの連携

Splunk On-Callは、ITサービス管理ツールを含む100種類以上のアラートソースに対応しています。

インシデント対応の概要

インシデント対応とは、ITインシデントをリアルタイムで検出し、分析、解決するプロセスです。システムと人手で調査と分析を行い、ビジネスへの悪影響を最小限にとどめることを目指します。

インシデントの一般的な防止策には、ソフトウェアの定期的なアップデートやイベントの監視などがあります。理想的には、インシデント対応計画を作成して、インシデントの解決と根本原因の特定を迅速化し、再発を防止します。

ITサービス管理(ITSM)における一般的な定義では、インシデントは、ITサービスの予定外の中断、または中断につながる事象を指します。この定義に従うと、ネットワーク品質の低下から、ディスク領域の不足、サイバー攻撃まで、幅広い問題がインシデントに該当します。

セキュリティインシデントはインシデントの一種で、現在発生している脅威から、すでに起きてしまったデータ漏えいまで、幅広い問題を含みます。その発生元は外部だけでなく組織内部の場合もあります。セキュリティインシデントには以下のようなものがあります。

  • 従業員が職場のコンピューターからギャンブルサイトにアクセスした
  • ベンダーが閲覧を許可されていないデータをダウンロードした
  • マルウェア攻撃を受けた

インシデント対応は、包括的なインシデント管理プラクティスの一部です。インシデント管理とは、ビジネスサービスを脅かしたり妨害したりするITインシデントを検出して修正するプロセスを指します。その目的は、サービスの可用性を維持し、サービスが停止した場合はビジネスへの影響を最小限に抑えながらすみやかに復旧させることです。

インシデント対応では、発生したインシデントへの対応のみが対象になりますが、インシデント管理は、インシデント対策の計画から、早期検出、継続的な分析、再発防止、文書化まで、幅広い作業を含みます。

体験する

作業を能率化し、効率と生産性を向上させて、オンコールの負担を軽減しましょう。