ITチームは毎日、洪水のようなアラート、つまりパフォーマンスの問題、サービス障害、不審なアクティビティに関する何千ものメッセージを受け取ります。通知があまりにも多いため、その状況に圧倒されて、重大な問題を見逃したり、誤検知のアラートの追跡に時間を浪費したりする事態に容易に陥ってしまいます。アラートを相関付けしてグループ分けすれば、ノイズを減らして全体像を把握するのに役立ちますが、その相関関係を定義する作業自体に、多くの時間と経験、そしてシステムやそれにまつわる過去の経緯などについての豊富な知識も必要になります。この問題を解決するのが、Splunk IT Service Intelligence (ITSI)のEvent iQです。
現代のIT環境はかつてないほど複雑さが増しています。クラウドサービス、オンプレミスインフラ、ネットワークシステム、増大するアプリケーションスタック。これらすべてを健全な状態で運用することが今日のIT運用チームの責務です。新しいシステムを導入すれば例外なく、アラートや通知の数が増えていきます。ITチームは毎日のように、何百、場合によっては何千という数のアラートを受け取ることになります。
しかし、これらのアラートの大部分は、それのみで問題の全体像を伝えるものではありません。より大きな問題の兆候について警告するアラートもあれば、重複するアラートや、アラート対策が貧弱であるために発生するアラートも数多くあります。たとえば、ベースラインの設定が適切でないために誤検知が発生する場合や、ビジネスに影響しない些細な事象にアラートが設定されている場合などです。コンテキストがなければ、どのアラートが緊急でどのアラートはそうでないかを知ることは不可能です。ITチームが直面する主な問題は次のとおりです。
こうした問題の結果として、チームは誤検知や重複するアラート通知の追跡に忙殺され、状況が悪化するまで重大な問題が見逃されたままになってしまいます。デジタルビジネスのペースと複雑さが増大しているため、手作業でアラートを管理する従来のアプローチでは、とても対応できません。
これらのアラートをイベント別にグループ分けすると、アラートノイズを効果的に減らせます。ガートナー社が提唱したAIOpsというカテゴリをご存知でしょうか?これは最近では、イベントインテリジェンスという名称に置き換わりましたが、この用語を聞いたことがある方ならすぐにご理解いただけるでしょう。アラートのグループ分けは、アラートノイズを減らして、環境全体で何が起こっているかを明確に知るための優れた方法ですが、そのための相関関係を作成するには膨大な時間がかかる上に、環境、ドメイン、およびそれらの関係についての詳細な知識も必要になるという問題があります。この問題の解消に役立つのがSplunk ITSIのEvent iQです。
Event iQでは、AIを活用してアラートの相関付けを行うことでアラートノイズを減らします。関連するアラートをグループ分けし、重大なインシデントを際立たせ、チームが必要とするコンテキストを追加することで、問題の本質を把握して、より短時間でトリアージを行うことができるようになります。Event iQの機能を支えているのがAIです。AIは柔軟性に欠ける手動のルールに頼るのではなく、実際のデータから学習し、パターンを見つけて重要度順にフィールドをランキングします。その結果、精度が高まり、手作業が減り、より信頼性の高いインシデント対応を迅速に実施できるようになります。

Event iQには以下のようなメリットがあります。
ノイズをすばやく簡単に排除して、最も重要な問題に集中できるようにしましょう。
今すぐITSIのEvent iQでAIを活用し、アラートに埋もれてしまうことなく、常に先回りしてインシデントに対応できる体制を整えてください。
詳細は、次のビデオ(英語)でお確かめください。
さらに詳しい情報および具体的な作業手順については、Splunk ITSIのドキュメントをご覧ください。
#splunkconf25のハッシュタグが付いたツイートをぜひご確認ください。