今年の.conf25で、Splunkは、AI時代のデジタルレジリエンスの意味を定義します。Splunkは、すべてのマシンデータを1カ所に統合するSplunkプラットフォーム、エージェンティックなSOC (セキュリティオペレーションセンター)を実現するSplunk Security、エージェンティックAIを活用してオブザーバビリティを強化するSplunk Observabilityで構成される、世界屈指の統合プラットフォームを提供しています。これらのツールを通じて、データの迅速な相関付け、有意義なインサイトの獲得、コラボレーションの強化、そして安全で信頼できるシームレスなカスタマーエクスペリエンスの提供を支援します。
このミッションを加速させ、エージェンティックAIを活用したオブザーバビリティの新たな章に踏み出すために、Splunkは、ビジネスに影響を及ぼす問題の検出と調査をAIで効率化するいくつかの重要な機能を発表しました。
AIアプリケーションやそのインフラの健全性とパフォーマンスを維持し、コストを最適化するために、以下の機能もリリースしました。
最後に、IT運用チームとエンジニアリングチームが、統一されたエクスペリエンスで、3層アーキテクチャ環境とマイクロサービス環境をまたいでテレメトリデータをすばやく相関付け、ビジネスに影響を及ぼす重大な問題の優先順位を判断できるようにするための、いくつかの新しいイノベーションを発表しました。主な機能には以下のものがあります。
エージェンティックAIが、先進的なオブザーバビリティプラクティスを構築するためのルールを書き換えつつあります。開発の領域ではバイブコーディングが注目されており、近い将来、人間がほとんど、またはまったく関与せずにアプリケーションを作成できるようになるでしょう。
AIの能力はコードの記述にとどまりません。今日では、インシデント対応ワークフロー全体を通じて優れたオブザーバビリティのあり方を書き換えています。Splunkは何年も前から、ユーザーの支援を目的として製品にAIを組み込んできました。そしてこのたび、Splunk Observabilityポートフォリオ全体で問題の調査と解決をさらに加速させる、エージェンティックAIを活用した数々の機能を発表しました。AIドリブンのアラート相関付け、エピソード要約、AIインスタントトラブルシューティングなど、エージェンティックAIを取り入れて、ビジネスに影響を及ぼすインシデントをより迅速に理解、トラブルシューティング、解決できます。
サーバーのダウンやアプリケーションの動作の異常など、何か問題が起きると、そのアラートだけでなく、関連するアラートが連鎖的に発生することがあります。こうしたノイズが大量にあると、問題の根本原因を特定するのが難しくなり、解決が遅れがちです。Splunk IT Service Intelligence (ITSI)のEvent iQを使えば、アラートのノイズを低減し、初心者から上級者まですべての担当者が、アラートの管理に費やす時間を節約して、重要なサービスの円滑な運用を維持することに注力できます。
Event iQは、AIドリブンのアラート相関付けにより、関連するアラートをグループ化し、早急に対応が必要な重大インシデントをわかりやすく表示することで、アラートのノイズを低減します。重要なフィールドを推測し、イベント相関付けの詳細条件を設定して、プレーンテキストによる説明を付加することで、チームがすばやくアラートの関連性を理解し、特に重大な問題に集中して対応できるようにします。
関連するアラートは「エピソード」と呼ばれるグループに自動的にまとめられます。数十または数百件にも及ぶことのある通知を手動で何時間もかけて調べる必要はもうありません。代わりに、Event iQが情報を整理し、発生した問題、発生日時、影響のあるシステムを一目でわかるように表示します。
Event iQでは、わずか数クリックでアラートの自動相関付けを設定できます。エピソードを開けば問題の全体像をすばやく把握できるため、いくつものタブを行き来したり、足りない情報を探し回ったりする必要はありません。すべてが明確に説明されるため、アラートがなぜそのようにグループ化されたかを常に理解できます。
Splunk ITSIではすでに、アラートを相関付け、関連するアラートをエピソードにまとめることで、アラートのノイズが低減されています。これに加えて、高度なAIを使用することで、エピソードに関する重要な情報が抽出され、わかりやすいサマリーを生成する機能が加わります。抽出される情報には、発生した問題、発生日時、特に重要なイベント、原因の初期診断などが含まれます。そのため、今まで多数のタブをクリックして確認していた関連性の高い詳細情報や推奨される次のステップを、ワンクリックで把握できます。これにより、時間の節約と混乱の回避につながるだけでなく、この業務に就いたばかりの担当者でもプラットフォームから早期に価値を引き出すことができます。さらに、サマリーの共有やServiceNowなどのツールへの追加も簡単にできるため、最新の状況を常に周知できます。このように、エピソード要約は、業務の効率化、対応の迅速化、重要なサービスの円滑な運用に役立ちます。ITSIのエピソード要約は現在、アルファ版として提供されています。
この機能をお試しになりたい場合は、Splunkの「お客様の声」サイトからリクエストをお送りください。
従来、DevOps担当者やサイトリライアビリティエンジニア(SRE)は、障害やパフォーマンスの問題の原因を特定するために、複数のツールや画面を切り替えながら、ダッシュボード、ログ、メトリクスを調査する必要がありました。Observability CloudのAIインスタントトラブルシューティングは、アシスタントSREのような役目を果たし、サービスとインフラに関するすべてのデータを自動的に調査して、アプリケーションやインフラに問題があるかを特定し、最も可能性の高い根本原因を提示します。これらはすべて既存のワークフロー内で行われ、情報は平易な言葉で提供されます。
可能性の高い順に並べられた原因のリスト、明確な影響分析、実用的な推奨事項が、必要なときに必要な場所に表示されるため、画面、タブ、ツールを行き来して時間を浪費することなく、これまで手動の調査で数時間以上かかっていたインサイトの導出を数分で完了できます。
アラートが発生すると、AIが、最近のデプロイから、Kubernetesイベント、過去のインシデント、以前の修正以来目立ち始めたパターンまで、あらゆるデータを分析し、根本原因を特定して、結果をわかりやすく表示します。そのため、担当チームはすばやく的確に問題に対処して、ダウンタイムを削減し、サービスの運用を円滑に維持できます。Observability CloudのAIインスタントトラブルシューティングは現在、アルファ版として提供されています。
AppDynamicsにも、エージェンティックAIを組み込んだAIインスタントトラブルシューティングが追加されます。この新機能では、インシデントが発生と同時に分析され、考えられる原因が究明されて、次に取るべきステップが提案されます。そのため、異常や健全性ルール違反などの問題をすばやく理解し、対処できます。
異常や健全性ルール違反が発生すると、AIは、ただフラグを立てるだけでなく、何が起きたか、なぜ起きたか、解決するには何をすべきかを説明します。そのため、複数のダッシュボードを切り替えたり、重要なメトリクスを推測したりしなくても、明確な根本原因が簡潔にまとめられたサマリーを必要な場所で確認できます。
これにより、システムのエキスパートでなくても、問題をよりすばやく的確に解決できます。AIインスタントトラブルシューティングを利用すれば、知識不足を補い、ワンクリックでガイド付きの調査を開始し、リアルタイムデータのコンテキストに沿った実用的なインサイトを獲得できます。AppDynamicsのAIインスタントトラブルシューティングは現在、アルファ版として提供されています。
ご存知のとおり、AIは今日、あらゆる場所で使われています。AI固有のテレメトリに対応したインフラは複雑で、高いレジリエンスが求められます。そのため、IT運用チームやエンジニアリングチームには、その維持にかかる手間やコストを最小限に抑えることのできる強力なツールが必要です。また、意欲的なビジネス目標や顧客からの高い要求に対応するには、品質とパフォーマンスに優れたAIモデル、エージェント、アプリケーションを開発および展開し、インシデント対応ライフサイクルのあらゆる段階で、それらが意図したとおりに動作し、ビジネス目的に沿って動作していることを確認する必要もあります。
AIの普及とともに、アプリケーションの構築に必要なインフラスタックが大きく変化しています。GPU、クラウドコンピューティング、ホスティングサーバーなどの低レベルのインフラコンポーネント上で、大規模言語モデル(LLM)、ベクトルデータベース、AIフレームワークとライブラリなどが運用されるようになりました。これらのインフラでセキュリティ脅威、パフォーマンスの低下、効率の低下などの問題を検出して対応するには、従来のインフラ監視と同様に環境全体を詳細に可視化するほかに、新たなAIコンポーネントを環境全体でリアルタイムに可視化する必要があります。IT運用チームやエンジニアリングチームは、AI Infrastructure Monitoringによって、システムの信頼性、セキュリティ、拡張性を確保できます。
豊富なデータを提供するダッシュボード、ディテクター、トランザクショントレースを確認して、ビジネスの健全性、リソースの使用傾向、パターン、外れ値と、問題のあるAIインフラコンポーネントを相関付けることができます。これらの表示では、「ノイジーネイバー(うるさい隣人)」のプロアクティブな検出、AIアプリケーションやサービスの運用メトリクスに基づくアラートの生成、リソースの競合やワークロード需要の過不足などの問題のトラブルシューティングもできます。この機能は最終的に、セキュリティ、パフォーマンス、コスト、レピュテーションリスクの軽減に役立ちます。
AIブームの要因には、AIエージェントやエージェンティックアプリケーションの台頭もあります。これらのAI技術では、LLMを活用して、データを解釈し、推論を行い、複数ステップのタスクを実行します。人間の脳と同じように、エージェントはLLMを通じて情報を学習および保持し、効果的に処理します。そのため、LLMの管理を怠ると、品質が低い、または誤解を招く出力や回答が頻繁に生成されるようになって、顧客からの信頼やエンドユーザーエクスペリエンスが低下し、修正コストが増大する可能性があります。
AI Agent Monitoringを使用すると、LLMやLLMを利用するエージェントによる誤った回答、不正確な回答、望ましくない回答をIT運用チームやエンジニアリングチームがプロアクティブに特定、トラブルシューティングして、アプリケーションの信頼性、セキュリティ、精度を維持できます。トランザクション、エラー率、パフォーマンスに関する確立されたメトリクスを追跡し、やり取りをドリルダウンして、LLMやツールの呼び出し失敗といった、アプリケーションの動作に影響を及ぼす問題を特定できます。さらに、Cisco AI Defenseとの統合により、エージェントとLLM全体で、プロンプトインジェクション、データ漏えい、有害なコンテンツなどの重大なセキュリティリスクを一元的に可視化することもできます。この強力な可視化機能では、モデルやエージェントの使用状況、コスト、パフォーマンス、品質基準に関する詳細なインサイトも提供されます。そのため、AI SREチームやMLSecOpsチームは、リスクと運用効率の両方を単一の画面で管理できます。
AppDynamicsのAI Agent Monitoringでは、AIエージェント、インテグレーション、基盤インフラをリアルタイムで監視するための統合的なインターフェイスが提供されます。このインターフェイスで、LLMが内部ポリシーや規制に準拠した方法で使われているかどうかを追跡して、コンプライアンスリスクを低減できます。また、リソースの使用状況とコストを可視化して、最適化や効率的な割り当てに役立てることもできます。健全性とパフォーマンスの監視を効率化することにより、ユーザーやビジネスアプリケーションに影響が及ぶ前に問題を検出して解決できます。カスタマイズ可能なダッシュボードとビジネスジャーニーマッピングを使えば、AIエージェントの効果について、より実用的なインサイトを獲得できます。AppDynamicsのAI Agent Monitoringは、ミッションクリティカルなAIイニシアチブの適切な管理、拡張、健全性の維持を支援します。
急成長する「エージェントのインターネット(IoA:Internet of Agents)」では、新時代のオブザーバビリティが求められます。シスコのイノベーションを牽引する部門、Outshiftは、7月、あらゆるベンダーのエージェントがシームレスにコラボレーションする未来の基盤の構築を目指すプロジェクト「AGNTCY」をLinux Foundationに委譲しました。オープンスタンダードを活用したIT運用チームとエンジニアリングチームの支援に取り組むSplunkは、AGNTCYに積極的に貢献し、OpenTelemetry (OTel)を牽引する組織と連携することで、このビジョンを推進しています。
Splunkは、さまざまなAI環境をまたぐシームレスなデータ収集を促進する、標準化され拡張可能なテレメトリフレームワークを確立することで、OTelセマンティック規約の進歩に寄与しています。Splunkプラットフォームでは、AGNTCYのMetrics Compute Engineを統合することで、ベンダーに依存せずに異なるAI環境を包括的に可視化するための、拡張性に優れ、相互運用が可能なオブザーバビリティを実現しています。これにより、生のテレメトリから実用的なインサイトを引き出して、エージェンティックアプリケーションのパフォーマンスに関する基本的なメトリクスと、事実性などの高度なメトリクスの両方を提供します。
最後に、より詳細なビジネスコンテキストを提供して重要事項の優先順位付けを支援する、統合的なオブザーバビリティエクスペリエンスをご紹介します。これらの機能を活用すれば、パフォーマンスに優れたアプリケーションや信頼性の高いシステムを大規模に構築するために必要な、コンテキストに即したインサイトを獲得し、重要なビジネスプロセスを保護できます。しかも、そのすべてを1カ所からリアルタイムで行うことができます。
アラートやメトリクスの量があまりに多いと、ビジネスに本当に重要なインサイトを獲得するのが不可能に感じられるかもしれません。Business Insightsは、重要なビジネスプロセスにアプリケーションパフォーマンスが及ぼす影響をリアルタイムで可視化します。これにより、エンジニアリングチームやビジネスチームは、収益への影響に重点を置いた意思決定ができます。また、今回のリリースでは、単一の統合ジャーニービューで、ローンやクレジットの承認プロセスなど、長期にわたるプロセスを可視化し、技術的なパフォーマンスをビジネスKPIに関連付けることもできます。従来のSLAメトリクスだけでなく、収益への影響も明確に示されるため、本当に重要な問題に注力できます。Business Insightsは現在、アルファ版として提供されています。この機能をお試しになりたい場合は、Splunkの「お客様の声」サイトからリクエストをお送りください。
多くの組織は、従来の3層型アプリケーションとクラウドネイティブサービスの両方を運用しており、2つの環境をまたいでパフォーマンスを監視するためのアプリケーションパフォーマンス監視(APM)ツールを必要としています。Splunkは、そのニーズに対応するため、Splunk Observability Cloudに、クラウドネイティブアプリケーションのAPMを強化し、ハイブリッド環境のサポートを拡張する新機能を追加しました。いずれも、従来の3層型アプリケーション監視の実績が豊富なAppDynamicsの技術を基盤にしています。
主な機能には以下のものがあります。
これらの機能を組み合わせることで、ハイブリッドアプリケーションやマイクロサービスベースアプリケーションを構築および運用する環境で、真に統合的なAPMソリューションを実現できます。
ビジネスSLAに対応しながら、修復ワークロードを管理し、さらにイノベーションを推進するのは困難です。Secure Application for Splunk Observability Cloudを使えば、エンジニアリングチームは、バックログにある重大な脆弱性のチケットすべてが、実行中のアプリケーションに対する検証済みの真のリスクを表しているという保証を得られます。
従来の静的な脆弱性および脅威検出ツールとは異なり、Secure Applicationでは、Splunk Observabilityの導入済みエージェントを利用して、セキュリティがオブザーバビリティフレームワークに直接統合されます。このイノベーションにより、セキュリティに配慮しながら開発業務を遂行するのが容易になります。アプリケーションセキュリティをオブザーバビリティワークフローにシームレスに組み込み、ランタイムの調査結果に包括的なセキュリティインテリジェンスを補強することで、現時点での攻撃の受けやすさとアプリケーションへの直接的な影響に基づいて、重大な脆弱性の優先順位を判断できます。これにより、SLAを気にしながら複数のツールを行き来して状況を調査する負担から解放されます。
Secure Applicationにより、脆弱性が、その影響を受ける特定のマイクロサービスにObservability Cloud APMサービスマップ内で直接マッピングされます。このアプリケーションコンテキストは、セキュリティチームが、既知の脆弱性と、組織の本番環境で実際に脅威をもたらしているリスクとを区別し、多数の脆弱性アラートの中からノイズを排除するために役立ちます。現時点での攻撃の受けやすさとアプリケーションへの直接的な影響に基づいて、アラートされた脆弱性の優先順位をすばやく判断し、未然にパッチ適用や問題の修正を行うことで、エンドユーザーに悪影響が及んだり、組織のセキュリティが脅かされたりするのを防ぐことができます。
アプリケーション脆弱性検出は現在、アルファ版として提供されています。この機能をお試しになりたい場合は、Splunkの「お客様の声」サイトからリクエストをお送りください。
これまで、Splunk Observability Cloudでクエリーとホストのパフォーマンスを可視化するときは、APMのデータベースクエリーパフォーマンス機能やデータベースインフラ監視機能を使用するのが一般的でした。しかし、多くのお客様から、時間のかかるクエリ―エリーの根本原因についてより詳細なインサイトを取得できる統合的なUIを望む声をいただいていました。
データベース監視は、OpenTelemetryをベースとし、あらゆるタイプのデータベースに関する詳細なインサイトを提供する、最新の強力なソリューションです。これにより、アプリケーションチームやデータベースチームは、待機時間、待機カテゴリ、CPU時間、メモリー使用率、実行計画など、クエリーレベルの豊富なインサイトに基づいて、非効率なクエリーをすばやくトラブルシューティングできます。データベースのパフォーマンスをアプリケーションサービスやインフラメトリクスと相関付けることで、重要事項の優先順位を判断するとともに、非効率なクエリーを特定して競合を回避し、コストを抑制できます。
今回のリリースではMicrosoft SQL Serverがサポートされ、今後、他のデータベースのサポートも順次追加されます。データベース監視は現在、アルファ版として提供されています。この機能をお試しになりたい場合は、Splunkの「お客様の声」サイトからリクエストをお送りください。
Splunk Observability Cloudがついに、FedRAMP Moderate認証を数カ月以内に取得できる見込みとなりました。この最新のマイルストーンを達成すれば、Splunk Observability Cloudは、政府機関が政府の機密データを安全に管理するために求められる世界トップクラスのセキュリティ標準を満たすことになります。
FedRAMP Moderate認証の取得が完了すれば、行政・公共機関のお客様は、Splunk Observability Cloudを使って、オンプレミス、ハイブリッド、クラウドネイティブ環境をまたぐクラウドトランスフォーメーションを加速させ、市民サービスへの要求の高度化に効率的に対応し、クラウドとサイバーセキュリティ機能を強化するとともに、シームレスなデジタルエクスペリエンスを提供できるようになります。
単一のソリューションで、ユーザーのやり取りを包括的に可視化して、問題をすばやく検出および解決し、継続的な改善を促進する環境を整えることで、市民からの信用を高め、信頼できるサービスを一貫して提供できます。
アプリケーションのエクスペリエンスは、ネットワーク(CDN、DNS、インターネット)と外部サービス(サードパーティAPI、クラウドプラットフォームなど)の複雑な相互関係に依存しており、その多くは、IT運用チームが管理できる範囲外にあります。その問題に対処できるのが、Splunk Observability Cloudのリアルユーザー監視(RUM)とThousandEyesの統合です。これにより、Splunkの包括的なリアルユーザーエクスペリエンスデータとThousandEyesのネットワークインサイトを1つの画面に集約できます。エンジニアリングチームは、問題の原因がアプリケーションとネットワークのどちらにあるかをすばやく判断し、トラブルシューティングを効率的に行って、インシデントを短時間で解決することで、パフォーマンスとユーザーエクスペリエンスを向上させることができます。Splunk Observability CloudとThousandEyesをご利用のお客様は、追加費用なしでこの機能をご利用いただけます。この機能は現在、アルファ版として提供されています。この機能をお試しになりたい場合は、Splunkの「お客様の声」サイトからリクエストをお送りください。
エンジニアリングチームと製品チームは、優れたユーザーエクスペリエンスを提供し、ビジネス成果を向上させる責任を共有しています。デジタルエクスペリエンス分析(DEA)は、エンジニアリングチーム、製品チーム、設計チームが必要とする、ユーザーの行動、意図、感情に関する深いインサイトを提供することで、既存のリアルユーザー監視(RUM)機能を拡張します。サイロ化したDEAツールとは異なり、行動データをアプリケーションパフォーマンスデータと相関付けることができるため、アプリケーションのインシデントがユーザーエクスペリエンスに及ぼす影響を把握し、トラブルシューティングをすばやく行うことができます。RUMと同じOpenTelemetryインストルメンテーションエージェントが使われるため、導入はシンプルで、負荷が増えることもありません。今回の初期リリースでは、コンバージョンファネル分析と、各ドロップオフポイントでの詳細なセッションリプレイが導入され、フリクションポイントを簡単に特定して対応できます。デジタルエクスペリエンス分析は現在、アルファ版として提供されています。この機能をお試しになりたい場合は、Splunkの「お客様の声」サイトからリクエストをお送りください。
クラッシュ、エラー、複雑なフローが発生したときは、ユーザー視点で状況を把握する必要があります。それを可能にするために、AppDynamicsにブラウザとモバイルのセッションリプレイ機能が追加され、Observability Cloudのセッションリプレイ機能がブラウザだけでなくモバイルにも対応するように拡張されました。セッションリプレイでは、ユーザー操作を動画のような動的なジャーニーとして記録し、豊富なセッションメタデータと組み合わせることで、問題の発生時にユーザーが実際にどのような経験をしたかが明確に可観化されます。このコンテキストを把握できれば、パフォーマンスの問題をトラブルシューティングするだけでなく、ユーザビリティを評価し、フリクションポイントを特定して、ユーザーエクスペリエンスに関する隠れた課題を明らかにすることができます。AppDynamicsのセッションリプレイについてはこちらをご覧ください。
この機能では、AppDynamicsユーザーに、AppDynamicsまたはObservability Cloudでテレメトリデータを収集するための共通のエージェントが提供されます。ユーザーは、デプロイパイプラインや統合パイプラインで大規模な変更を行うことなく、追加コストの発生も回避しながら、Splunk APMツールを評価できます。
このエージェントには、AppDynamicsエージェントコードとSplunk OpenTelemetryコードの両方が含まれ、他のAppDynamicsエージェントと同じように導入されます。既存のエージェントを更新するだけで、内部に組み込まれているOpenTelemetry機能が通常のアップデートとして追加されます。アップデートは、スマートエージェントを介して行うことも、現在使用している方法で行うこともできます。
エージェントには3つのモードがあります。
このブログ記事をここまでお読みいただき、ありがとうございます。私たちはこの1年間、統合的なオブザーバビリティ、AIのためのオブザーバビリティ、そしてエージェンティックAIによるオブザーバビリティという大規模な新機能の提供に向けて取り組んできました。ぜひこれらの機能をお試しいただき、「お客様の声」プログラムを通じてご意見をお聞かせください。
.conf25は、SplunkとCiscoにとってオブザーバビリティの新時代の幕開けとなりました。エージェンティックAIの未来に向けた旅路を、皆さまと共に歩めることを大変嬉しく思っています。
Many of the products and features described herein remain in varying stages of development and will be offered on a when-and-if-available basis. The delivery timeline of these products and features is subject to change at the sole discretion of Cisco, and Cisco will have no liability for delay in the delivery or failure to deliver any of the products or features set forth in this document.
#splunkconf25のハッシュタグが付いたツイートをぜひご確認ください。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。