
デジタルレジリエンスを強化するAIの理念
今後の製品戦略にAIを取り入れてサイバーセキュリティとオブザーバビリティの成果を向上させるための、Splunkの3つの戦略をご紹介します。
Splunkが先頃、米国と欧州地域でリリースしたObservability CloudのAI Assistantが、大変な反響を呼び、多くの関心を集めました。しかし、大きな力には大きな責任が伴うものです。目新しい最新技術が登場するときはいつもそうですが、AI Assistantについても、どうすれば適切に活用し、その可能性を最大限に引き出せるのかわからない方もいらっしゃるかもしれません。
そのようなお客様は、ぜひこの記事を参考にしてください。私はグロースエンジニアリングマーケティングチームに所属するSplunk社員ですが、自分自身でもAI Assistantを試してみずにはいられませんでした。そして、AI Assistantを日々の仕事に役立てられないかと試行錯誤した結果、オブザーバビリティの関連作業を大幅に改善するのに役立つ7つのユースケースを見つけたので、ご紹介します!
エンジニアであれば誰もが答えを知りたい単純ながら重要な問いがあります。それは、インスタンスの現在の稼動状況です。最新のSplunkなら、インスタンス名を入力するだけで、AI Assistantがインスタンスの詳細な分析結果を提示してくれます。まるで魔法のように思えるかもしれませんが、それは実際に魔法と言う他ありません。以下は、あるインスタンスについてAIが生成したシンプルな応答の例です。
このインスタンスの管理を数年間担当してきましたが、これほど深いインサイトを得たことはありませんでした。今では、AIが提案する最適化の内容を確認しながら、自信を持ってシステムの信頼性を高める作業を進めることができます。
アプリケーションへのリクエストにはそれぞれトレースIDが付けられます。OpenTelemetryにおける「トレースID」とは、システムによって監視されている特定のリクエストや処理に割り当てられた一意の識別子です。いずれかのバックエンドの呼び出しについてAPMのアラートを調査する場合、そのトレースIDを取得してAI Assistantに渡し、問題を個別に分析することができます。以下に示すのは、あるトレースIDについてAIが生成した応答の例です。応答内容を確認したら、余計な手間をかけることなく、後はチケットを作成するだけで、開発チームが迅速に問題を解決してくれます。
![]() | 主な調査結果
エラー分析
推奨事項
|
私は常に、コード、サービス、機能に関するフィードバックを重要視しています。運用開始後のパフォーマンスに問題はないか、重大なボトルネックはないか、要件を満たしているか、などを把握したいからです。フィードバックを活用すると、自分の仕事に不備がないことを確認するだけでなく、改善すべき箇所をあぶり出して、必要な変更に備えることもできます。ちなみに、フィードバックは特定の実装に関するものであっても問題ありません。
このようなケースは、AI Assistantが得意とする分野であり、貴重な洞察を得られるばかりでなく、時には自尊心をくすぐられることもあります。以下は、特によく使用されるサービスエンドポイントの1つを最適化するための新しい実装について、AIに尋ねた際のフィードバックです。思わずニンマリしてしまいました。
APMのAIに、本番環境の共通サービスの過去8日間の分析を依頼したところ、「GET /api/bin/careers/joblistエンドポイントは高い使用率(8万7,001件のリクエスト)ながら、エラーは発生しておらず、高い安定性を示しています」という分析結果が得られました。
先日、友人である「AI」に、「モノリシックアプリケーションの過去6週間のメモリ使用状況を分析してください」と依頼しました。すると予想したとおり、アプリケーションでメモリリークが発生している可能性があるという分析結果が出ました。AI Assistantは「申し上げにくいのですが…」と切り出してから、その分析結果を伝えてくれました。
それに対し私は、「気遣いは要りませんよ。むしろ感謝したいぐらいです」と応えました。実は6カ月前、ある問題が本番環境で発生した後、私も同様の分析を行って同じ結論に達していたのです。ただ、チームメンバーに私の意見は受け入れられず、分析結果は無視されてしまいました。しかし、こうしてAIの分析結果を手に入れた今、もう無視することはできないでしょう。今度こそチームは行動を起こしてくれるはずです。
![]() | 分析結果ユニークIDとしてi-039e37a2bdd344f04_us-west-1_576561709469を持つAWSインスタンスの過去24時間のメモリ使用率と合計メモリの分析に基づいて、以下の結果が得られました。
メモリ使用率が増加を続け、大幅な低下が見られない点を考慮すると、このインスタンスのワークロードのメモリ消費量が徐々に増加していると考えられます。 |
想定するトラフィック量に基づいて、現行システムの処理能力を評価する機会は少なくありません。たとえば、新製品のリリース、ブラックフライデーによるトラフィックの急増、システムキャパシティに関する経営幹部への安心材料の提供、などの場面が挙げられます。この評価の際に判断する必要があるのは通常、システムキャパシティが十分であるか、それとも追加のノードが必要になるかということです。
AI Assistantを使用すると、システムの状態に関するインサイトを簡単に取得し、十分な情報に基づいて今後の要件を予測できます。数週間前、私も同様の課題に直面しました。以下がそのときのAIによる分析です。参考にしてください。
![]() | 先月のwmd-srv-prodのサービスパフォーマンスから判断して、1時間あたりのリクエスト数があと1,000件増えても処理できるかどうかについてお答えします。 以下は、「wmd-svc-prod」環境における「commons-svc」の過去1カ月間のサービスパフォーマンスの分析結果です。
このサービスは、相当な数のリクエストを比較的低いエラー率で処理しています。現在の1時間あたりのリクエスト数は約72件です(1カ月間720時間で5万2,015件のリクエスト)。 1時間あたりのリクエスト数があと1,000件増えても処理できるか?現在のパフォーマンスメトリクスから判断する限り、エラー率は低く、サービスは安定しているように見えます。ただし、1時間あたり1,000件のリクエストを追加で処理する場合、負荷は大幅に増加します。以下に考慮事項を示します。
推奨事項:
|
オブザーバビリティを熟知している方なら、「未知の未知」という言葉の意味をよくご存知でしょう。AI Assistantを使うと、思いもよらない多くの気づきを得られます。
たとえば、以下のような発見があります。
AIを活用し始めると、そのような「未知の未知」を数多く見つけられます。アプリケーションの信頼性とパフォーマンスの向上を目指すのであれば、このような気づきの重要性はいくら強調してもし過ぎることはありません。最終的には、エンドユーザーエクスペリエンスの向上をもたらし、さらには、ゴーストサーバーの停止など、本当のコスト削減につながることも期待できます。
私たちが使用しているシステムはきわめて複雑です(そうでないシステムなんて今どきないと思いますが)。新しいチームメンバーがすぐに業務をこなせるようにサポートすることは、それ自体が大変な作業です。コードを提供したり、ドキュメントへのリンクやZoomの録画を共有したり、さらには対面でデモを行ったりすることもあるでしょう。それでも、後から質問を受けるのはよくあることで、「一体何回繰り返さなきゃならないんだ」と思ってしまうこともしばしばです。担当のスプリント作業で手一杯な中、「Googleで検索すればいいじゃないか」と言いたいところですが、社内アプリケーションであるため、そういうわけにもいきません。
こんなときこそ、Splunk Observability CloudのAI Assistantが窮地を救ってくれます。AI Assistantが、システムの概要、アプリケーションの詳細、リクエスト/レスポンスのワークフローやトランザクションフローの全体像について説明してくれます。そのため、新しいメンバーはシステムを隅々まで理解できるようになるだけでなく、AIを使わなければどのスタッフも気づかなかったような興味深い洞察をミーティングの場にもたらしてくれる可能性すらあります。
SplunkのAI Assistantのおかげで、新しいチームメンバーが短期間で生産性を上げるための知識を身につけている間に、私は自分のタスクに集中することができます。
AIがどのように学習を支援するかについて、以下に例をご紹介します。
AIがリンクを提示したダッシュボードで、サービスの詳細を確認できます。以下がそのダッシュボードです。
個々のエンドポイントすべてについての詳細を確認できます。
さらに、特定のトレースIDに関する説明をAIに依頼し、アプリケーションについての理解を深めることができます。
私がObservability CloudでSplunkのAI Assistantを使い始めたのは最近のことですが、それがオブザーバビリティにもたらす恩恵の大きさを日々実感しています。ぜひ皆さんにも私と同じ経験を味わっていただきたいと思います。ここまで一般的なユースケースを紹介してきました。チームで生成AIを活用しながら優れたカスタマーエクスペリエンスを提供するための参考にしていただければ幸いです。
善は急げです。さっそく始めましょう!すでにSplunk Observability Cloudをご利用の場合は、上記のユースケースをご自身でお試しいただけます。そうでない場合は、ぜひ無料トライアル版で詳細をご確認ください。AI Assistantのこちらのリソースもご利用いただけます。
こちらからは、AIのE-Bookをダウンロードできます。では、また次の機会にお目にかかりましょう。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。