Splunk Observability Cloudがさまざまな点でさらに進化しました。エンジニアリングチームは、環境全体をより詳細に可視化し、より統合的なインシデント対応アプローチを取り入れることで、雑音をはねのけ、トラブルシューティングを加速できます。最前線で対応に当たるエンジニアは、観測できないデジタルリソースは十分に守れないことを知っています。Splunkの新たなイノベーションによって、組織内で問題が発生したときに、クラウドネットワーク全体と各トランザクションでのエンドユーザーエクスペリエンスに関するより詳細なコンテキストを獲得して、問題の原因をすばやく特定できるようになりました。また、アラートの精度が向上したことで問題への対応をいっそう効率化でき、オンコールでの複雑なプロセスが単一の画面によって整理されています。
さらに、業界をリードするSplunkのログ機能とインシデント対応機能がSplunk Observability Cloudに統合されたことで、本番環境全体に及ぶ問題のトラブルシューティング時に複数のチーム間でコンテキストを共有できるようになりました。
詳細な可視化で原因究明を加速
複数の新機能により、テクノロジースタックとエンドユーザーエクスペリエンス全体をより詳細に可視化し、豊富なコンテキストを獲得することで、問題解決を加速できます。モノリシックアーキテクチャとマイクロサービスアーキテクチャのどちらでも、クラウドネットワークやKubernetesクラスター全体を対象に、問題が発生しているユーザーセッションやタグに関するコンテキストを獲得して、問題の原因をすばやく特定して顧客への影響を把握できます。
- Splunk Application Performance Monitoring (APM) Trace Analyzer:数十億のトランザクションからパターンを抽出し、タグ、ユーザー、サービスに固有の問題を高い精度で検出できます。タグとメタデータの無数の組み合わせから不具合を起こしている未知の問題を識別したり、特定のユーザーに関する問題をトラブルシューティングしたり、問題が各顧客層に及ぼす影響を把握することもできます。
- Splunk Infrastructure Monitoring Network Explorer:Splunk Infrastructure Monitoringの新機能であるNetwork Explorerはクラウドネットワークを可視化してくれるので、エンジニアリングチームはクラウドネットワークに関する問題の原因をよりすばやく特定できます。クラウドネットワークの健全性を簡単に監視、評価し、クラウド環境とネットワークトポロジーを明確に可視化できるほか、高コストなサービスやトラフィックパターンを識別してクラウドネットワークへの投資を最適化することもできます。
- Splunk Observability CloudへのDigital Experience Monitoring (DEM)の統合:ブラウザのRUMメトリクスを、Syntheticsテストを実施して得られたページレベルのパフォーマンスメトリクスと相関付けて、1つの画面で可視化できます。Syntheticsメトリクスと相関付けられたRUMメトリクスを統合的に可視化することで、問題の原因がシステムにあるのか地域固有のものなのか、また、問題がテスト上での異常なのかユーザーに実際に影響しているのかをすばやく判断し、問題の優先順位付けを行いすみやかに解決して、エラーのないデジタルエクスペリエンスを提供できます。
- Splunk Observability Cloudのログタイムライン:Splunkの強力なログ収集および表示機能を基盤とするログタイムラインでは、オブザーバビリティダッシュボードにログベースのタイムチャートを追加できます。これにより、ログデータに基づいて傾向を分析し、問題をよりすばやく効果的に調査して、解決までの時間を短縮できます。
- Splunk Infrastructure Monitoring Metrics Pipeline Management:Splunk Infrastructure MonitoringのMetrics Pipeline Managementでは、監視の規模を拡大する際、監視コストを大幅に増大させることなく、すばやいトラブルシューティングに必要なデータを収集できます。大量のメトリクスデータを簡単に管理、集約し、動的に定義されたポリシールールによって不要なデータを排除して、必要なデータのみを取り込み、保存、分析できます。
- .NETとNode.jsに対応したAPM AlwaysOn Profilingのメモリープロファイリング:AlwaysOn Profilingのメモリープロファイリング機能でサポートされる言語は増え続けており、このたび新たに.NETとNode.jsが追加されました。コードがCPUやメモリーの使用率に与える影響を.NET、Node.js、Javaアプリケーションで継続的に測定し、それをすべてのトレースデータと相関付けてコンテキストを抽出することで、問題を特定しやすくします。これらのすべてで、負荷は最小限に抑えられています。
統合的なインシデント対応アプローチで、混乱しがちなオンコールプロセスを整理
新たに追加されたSplunk Incident IntelligenceとAutoDetect機能によって、オンコールチームの効率を大幅に向上できます。アラートの精度を高め、ワークフローを合理化することで、チームの連携と効率を改善し、アラート発生から解決までのプロセスを加速してMTTD、MTTA、MTTRを短縮できます。
- Splunk Observability CloudのSplunk Incident Intelligence:Splunk Observability Cloudで利用できるこのインシデント対応ソリューションで提供されるデータによって、オンコールエンジニアリングチームは問題の診断と修復を行い、顧客に影響が及ぶ前にサービスを復旧できます。フルスタック、フルコンテキストのアラートを生成して予定外のダウンタイムを防止するとともに、チームの壁を超えたオンコールスケジューリング、エスカレーション、カスタム通知を含む統合的なインシデント対応を実現できます。
- Splunk Application Performance Monitoring (APM) AutoDetect:APM AutoDetectでは、機械学習を活用して、サービスに関するアラートの精度を大幅に向上し、設定に必要な手動作業を削減できます。各サービスのパフォーマンスベースラインの確立や、遅延、エラー、リクエスト量の突発的な変化を検出する自動ディテクターの作成、自動ディテクターに基づくアラート通知のカスタマイズと受信登録も簡単に行えます。これにより、アラートの設定変更にかかる時間を短縮し、クラウドネイティブ環境全体でアラートの精度を大幅に向上できます。
Splunkオブザーバビリティ製品の新しいイノベーションについて詳しくは、ウェビナー「Splunk Observability Innovations Showcase: Increased Visibility & A Unified Approach to Incident Response (Splunkのオブザーバビリティイノベーションのご紹介:可視化の強化と統合的なインシデント対応アプローチ)」にご参加ください。次のリンクから各ライブセッションにご登録いただけます。
ダウンタイム、サービス停止、重大なシステム障害は、ビジネスに深刻な影響をもたらす可能性があります。実際、Uptime Institute社の2022年障害分析によると、60%の障害が10万ドル以上のビジネス損失につながっています。統合セキュリティ/オブザーバビリティプラットフォームを提供するSplunkは今後も、お客様のパートナーとして、システムのパフォーマンスと信頼性を維持するデジタルレジリエンスの構築を全力でご支援します。
次のステップ:Splunk Observability Cloudのトライアル版で新機能を体験
Splunk Observability Cloudの新機能について学んだら、次はぜひそれらを体験してください。トライアル版ではSplunk Observability Cloudを、次のいずれかの方法でお試しいただけます。
- OpenTelemetryを使ったインストルメント(計装)によって自社アプリケーションのデータを使用する
- サンプルデータを使用する(12分程度でトライアル版の使用を開始できます)
14日間無料のトライアル版はこちらからお申込みいただけます!
このブログはこちらの英語ブログの翻訳、大森 明央によるレビューです。