新しい年のITOpsに関する主なトレンドについて、エキスパートの予測をご紹介します。
私が入社した当時は、使用しているサードパーティ製アプリケーションの一部が何時間にもわたって停止することは珍しくありませんでした。Splunk Observability CloudとSplunk独自のフォワーダー、ダッシュボードを使用することで問題の原因を突き止め、1週間、1カ月、そして最終的には1年間、システム停止ゼロを達成できました
Splunkは、自社のクラウドトランスフォーメーションを進めていくうえで、開発コストを抑えつつ、複雑なハイブリッド環境を管理する必要がありました。
Splunk製品を使用することで、ITチームは可視性を確保し、最適なサービス対応、システム停止の最小化、インフラの改善、より信頼性の高いアプリケーションパフォーマンスを実現できました。
Splunkは世界130カ国にお客様を持つ成長中のグローバル企業です。Splunkのお客様は、ビジネスレジリエンスを維持するために当社に信頼を寄せています。Splunkの国際ITチームにとっては毎日が時間との勝負であり、たった1回のシステム停止が致命的になることがあります。データ量の増加やクラウドトランスフォーメーションによって環境が複雑化する中、SplunkのIT、セキュリティ、DevOpsの各チームはSplunkプラットフォームを使用して連携し、環境の安全性を確保しています。
SplunkのITチームは、Splunk Cloud Platformを使用することでアップタイムと信頼性を確保し、Splunk社員が接続性と生産性を維持するために必要なツールを常に使用できるようにしています。また、社内の各チームは、Splunk Observability Cloudを活用して複雑な環境を把握し、データに基づいてすばやく行動できます。その結果、大幅なコスト削減と効率化を達成し、お客様やSplunk社員の満足度に直接効果をもたらしています。これこそWin-Winといえるでしょう。
Splunkの成長に合わせて、Splunkテクノロジーを支える幅広いサービスも成長しています。Splunkのクラウドビジネスインテリジェンスチームは、何が使用されており、コスト削減のために何を排除できるかを常に監視しています。同チームは、Splunk Cloud Platformを使用することで、お客様やSplunk社員によって使用されていない未使用の開発用インスタンスが、年間60万ドルにものぼることを突き止めました。
不要なコストを発見し排除することは、Splunkのビジネスレジリエンスにとって重要であるだけでなく、お客様に最適なサービスを提供するというSplunkのミッションにおいても重要です。Splunk Cloud Platformを使用するすべてのお客様に100%のアップタイムを保証することも重要なミッションの1つであり、Splunkではお客様がアクティブに使用しているリソースを最適化するために未使用のリソースを再割り当てしています。Splunkのクラウドビジネスインテリジェンスチームは、Splunkのプラットフォームを使用してコストと使用状況を分析し、不要になって放置されていた開発用のライブインスタンスを特定しました。古くなり使用されていないアプリケーションに関連するコストを排除することで、アマゾン ウェブ サービス(AWS)のコストを削減し、実行中のインスタンスが最適にプロビジョニングされるようにして、カスタマーエクスペリエンスと満足度を向上させました。
2020年に世界中がリモートワークに移行した際、従業員が生産的に働くために必要なツールはすべて提供できるものの、そのツールの信頼性が高くなければ、在宅勤務はうまく機能しないことがすぐに判明しました。サードパーティ製のコラボレーションアプリケーションが頻繁に停止するようになり、Splunkの従業員の生産性に影響を及ぼす恐れが生じたため、従業員コラボレーションエンジニアリングチームはSplunk Observability Cloudの機能を使って調査に取りかかりました。
「私が入社した当時は、システム停止が何時間も続くことは珍しくありませんでした」と、生産性およびプラットフォーム部門のシニアマネージャーであるGreg Warnerは話します。システム停止には高額なコストが伴い、このサードパーティ製のコラボレーションアプリケーションがダウンするたびに、1時間あたり平均60万ドルというコストが発生していました。そこでチームはSplunk Observability Cloudを使用して、メモリー管理などのログの重要な変数を追跡し、障害が発生する前に根本原因を特定できるようになりました。
こうした問題を解消することで、従業員コラボレーションエンジニアリングチームは、リリース更新などの脆弱なタイミングであっても、障害を事前に予測し防止できるようになりました。「Splunk Observability CloudとSplunk独自のフォワーダー、ダッシュボードを使用することで問題の原因を突き止め、1週間、1カ月、そして最終的には1年間、システム停止ゼロを達成できました」。
従業員コラボレーションエンジニアリングチームのメンバーは、大きな任務を背負っています。Splunkの包括的なクラウド移行戦略における重要な役割として、会社のツールやアプリケーションの広大なエコシステム全体にわたる問題に常に注意を払わなければなりません。そのサードパーティ製アプリケーションの1つに、Splunk社員がコラボレーションを行ううえで欠かせないアプリケーションがありました。そのため、このアプリケーションのクラウド環境への移行が決定された際、Splunk社員が作業を中断することなく継続できるよう、可能な限りシームレスに移行することが極めて重要でした。
しかし、この規模の移行には移動しなければならない大量のデータが伴い、複雑極まりない大掛かりな作業が必要です。そこでチームは、Splunk Cloud Platformを使用して負荷テストを実施し、機能を正常に移行できることを確認しました。Splunkのプラットフォームによってベンダーよりも先に根本的なツールの問題を特定し、チーム内部の拡張機能を改善できました。こうした取り組みのおかげで、チームは1度の週末で11,000人のユーザーをコラボレーションアプリケーションに移行することに成功し、世界中のユーザーにシームレスなエクスペリエンスを提供できました。