今日のIT環境は、ハイブリッド化とAIの導入を進めながら、急速に変化しています。こうした環境の中で直面している可視化の最大のギャップは、障害そのものよりも、システムの依存関係や、意思決定に必要なコンテキストを十分に把握できていないことに起因しています。たとえば、一見正常に動作しているアプリであっても、経路上のスイッチの不具合で動作が遅くなっている場合があります。また、顧客に影響が及んではじめてサービスのパフォーマンス低下に気づくこともあります。
こうした課題を踏まえ、Splunkは新たに、稼働状態の維持だけでなく成果にも重点を置いたオブザーバビリティ機能をリリースしました。
インテグレーション、イベントインテリジェンス、AIのためのオブザーバビリティを活用することにより、シスコ製品を含むテクノロジースタック全体を横断し、ネットワーク環境も含めてビジネスを可視化することで、真の問題をすばやく解決できます。パケットドロップのトラブルシューティングでも、AI対応アプリケーションの監視でも、Splunkは、手作業を減らし、コンテキストに基づくトラブルシューティングを可能にして、根本原因分析を効率化します。
パケットドロップがネットワークだけの問題ではないように、決済処理の遅れもアプリケーションだけの問題ではありません。これからは、パフォーマンスが低下したことだけでなく、それがビジネスに及ぼす影響や問題の修正方法も理解できるように、ネットワーク、サービス、アプリケーションの各層を関連付けて環境を包括的に可視化する必要があります。AIを活用したイベントの相関付けから、AppDynamics、ThousandEyes、ITSIなどの連携による統合的なオブザーバビリティまで、Splunkの最新イノベーションは、オブザーバビリティをインテリジェントな意思決定につなげて、問題がどこで起きても高い精度で早期に検出できるように支援します。
ThousandEyesとの新しいインテグレーションにより、ThousandEyesで生成されたイベント、アラート、メトリクスデータをITSIに取り込むことができます。これにより、ネットワークやアプリケーションの外形監視に基づいて問題を検出し、トラブルシューティングを迅速化して、ビジネスの健全性に影響するサービスを把握できます。
たとえば、上流のCDNやISPのボトルネックが顧客向けサービスに影響を与えていないかどうかを確認したり、パケットロスや遅延の影響を受ける地域や顧客セグメントおよびその影響度合いを把握したりできます。
Catalyst Centerで管理するデバイスとインターフェイスの健全性情報や、Merakiで管理するインフラ(スイッチ、ゲートウェイ、アクセスポイントなど)の情報を活用し、キャンパスとブランチの両方のネットワークをより詳細に可視化することで、ハイブリッドネットワーク環境のオブザーバビリティを拡大できます。これらのネットワーク情報は常にITサービスのメトリクスと相関付けられるため、ビジネスクリティカルなネットワークの問題を特定し、根本原因をすばやく突き止めてサービスを復旧できます。
Splunk Observability CloudとThousandEyesをまたぐ統合的な可視化により、ネットワークチームとアプリケーションエンジニアリングチームは、アプリケーションとネットワークどちらのパフォーマンス低下が問題の原因であるかをすばやく判断できます。その結果、チーム間で責任の押し付け合いが減り、コラボレーションが強化されて、問題の早期解決につながります。
AppDynamicsとObservability Cloudの連携による統合的なトラブルシューティングにより、最新のワークロードと従来型のワークロードを別々に監視する煩雑さを解消し、管理を一元化できます。
3層アプリケーション環境とマイクロサービス環境の新旧のワークロードを管理している場合でも、Splunk Observability CloudとSplunk AppDynamicsを使用すればシームレスにトラブルシューティングを行い、複雑さを軽減し、根本原因分析を効率化できます。
ユーザーによる実際の操作を視覚的に詳しく再現しながら、包括的なパフォーマンスメトリクスと相関付けることで、ユーザーの行動がWebアプリケーションやモバイルアプリケーションにどのように影響し、問題にどのように関連しているかを明らかにできます。この機能により、再現が難しい問題のトラブルシューティングを効率化し、ユーザージャーニーを最適化して、ユーザーエクスペリエンスとセキュリティイベントの両方に関する実用的なインサイトを獲得できます。
AIシステムによって、新たなテレメトリ層が加わると同時に、スタック全体にさらなる複雑さがもたらされます。組織にとって、AIワークロードの動作、パフォーマンス、下流システムへの影響をすばやく可視化することは大きな課題です。Splunk Observabilityは、AIインフラの監視から、AIモデルとのトランザクションの追跡、エージェンティックAIを使ったパフォーマンスの調査まで、AIを導入したシステムに特化したオブザーバビリティを実現します。
AIオーケストレーター、ベクトルデータベース、アプリケーションプラットフォーム、クラウドモデルプラットフォーム、基本言語モデル、モデル計算インフラのコンポーネントをリアルタイムで監視して、生成AIプラットフォームのパフォーマンスとスケーリングを管理できます。
これにより、過剰に使われているリソースとあまり使われていないリソース、コンポーネントのボトルネックの発生箇所、障害が発生しているコンポーネント、キュー内のリクエストの発行元などを把握できます。
LLMサービスの監視を通じて、AIアプリケーションのすべてのトランザクションを詳細に可視化できます。これにより、トランザクションの処理状況を把握し、パフォーマンスの問題の根本原因を特定して、サービスレベル目標を維持できます。
GPUインフラ、LangChainオーケストレーション、ベクトルデータベースのパフォーマンスを監視し、AppDynamicsやSplunk APMのデータと相関付けることで、LLMを認識した包括的なオブザーバビリティを実現できます。
「AIのためのオブザーバビリティ」ではAIスタックの監視に重点を置きました。一方で、AIをオブザーバビリティに活用すれば、インシデントの調査と対応方法を変革できます。以下のイノベーションでは、根本原因分析、アノマリ検出、イベント相関付けに強力なAIアシスタンス機能を取り入れて、負担を軽減し、検出や修復のスピードと精度を向上させることができます。
データベースの異常を自動的に検出して、ビジネストランザクションに影響が及ぶのを防ぎます。検出に機械学習を活用することで、手動での設定やしきい値の指定を不要にし、1分あたりの呼び出し回数(CPM)、接続数、実行時間などのメトリクスに基づいて異常を自動検出し、アラートを生成します。AIドリブンのアラートは調整が可能で、ビジネスニーズに合わせてモデルの感度を設定し、ノイズを低減できます。
アプリケーションのパフォーマンスに影響するインフラのパフォーマンス低下を自動的に検出し、根本原因を特定します。問題をすばやく解決するための推奨策を提案して、プラットフォームエンジニアからジュニアSREまで、すべてのチームを支援します。
これにより、アプリケーションのパフォーマンス低下の原因がインフラ、コード、ネットワークのいずれにあるかを判断したり、パフォーマンスに最も影響を与えているコンポーネントを特定したりできます。
AIを活用した分析により、数百のトランザクションスナップショットをコンテキストに基づいて調査し、異常を検出します。これにより、オンプレミスワークロード全体のMTTR (平均対応時間)を短縮できます。
AIドリブンのアラート相関付けにより、ノイズを動的にフィルタリングし、関連するイベントをグループ化して、早急な対応が必要な重大インシデントをわかりやすく表示します。重要なフィールドを動的に推測し、イベント相関付けの詳細条件を設定して、プレーンテキストによる説明を付加することで、チームが特に重大な問題に集中してすばやく対応できるようにします。
これにより、最も緊急性の高いパフォーマンスの問題や、最も可能性の高い根本原因を特定したり、インシデントが単独で発生しているのか、それとも、サービスの健全性に関するより広範な問題の一部なのかを判断したり、経営幹部向けのダッシュボードに表示すべきインシデントを選別したりできます。
Splunkが最近リリースしたObservability CloudのAI Assistantにより、クエリーを多用せずにオブザーバビリティデータを活用できるようになったことにも注目です。この機能はエージェントAIテクノロジーを搭載しており、クラウドアプリケーションやクラウドインフラに関する質問に回答します。プロンプトを入力すると、AI Assistantがログ、メトリクス、トレースデータをわずか数秒で分析して、考えられる根本原因やパフォーマンスのギャップに関する重要なインサイトを提供し、ITインシデントのトラブルシューティングに役立つ推奨アクションを提案します。このAI Assistantは、米国、オーストラリア、欧州の一部の地域で利用できます。
詳細についてはこちらをご覧ください。また、AI Assistantを使ってKubernetesの問題をすばやくデバッグする方法についてはこちらのビデオをご覧ください。
Splunkは、シスコプラットフォームとの包括的かつ緊密な統合、AIを活用したインサイト導出、AIワークロードに特化した可視化機能により、オブザーバビリティのベストプラクティスを実現し、インテリジェントな意思決定を促進します。複雑なハイブリッド環境の管理、LLMの導入、決済関連問題のトラブルシューティングなどいずれの場面であっても、これらのイノベーションが、シグナルを捉え、すばやく行動し、常に先回りして対応できるように支援します。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。