PLATFORM

機械学習でITSI導入環境をレベルアップ

Splunkは、お客様がデータの価値を最大限に引き出せるようサポートすることに力を注いでいます。最近の記事で、Lila Fridley機械学習を適用する際の最適なワークフローの選び方について、またVinay SridharがSMLEでの異常検出の例についてご紹介しましたが、このブログシリーズでは、それらに関連して、Smart ITSI Insights App for Splunkについて詳しく書いていきたいと思います。このAppは、ITオペレーターが機械学習を使ってITSIからさらにインサイトを得られるようにするために開発されたもので、データサイエンティストでなくても使いこなせる優れものです。

IT Service Intelligence (ITSI)導入環境の価値を最大限引き出せるようにお客様をサポートするにはどうしたらいいかと聞かれることがよくあるので、このシリーズでは、ITSIを最大限活用するための機械学習を用いた実用的なテクニックをご紹介したいと思います。

ほとんどのテクニックはSmart ITSI Insights App for Splunkに再利用可能なコンテンツとして搭載されていますので、ぜひAppをチェックして、以下にリンクしたブログ記事を読みながら各機能を試してみてください。

障害発生を事前に予測することは可能か?

ITSIの予測分析についてはよくご存知の方も多くいらっしゃるでしょう(予測分析の詳細はこちらで確認できます)。この予測分析はたしかに強力な機能ですが、お客様から、どのアルゴリズムを適用したらいいかわからない、あるいは予測対象のサービスとそのサービスの健全性スコアの算出に用いられるKPIとの関連性が予測できていないように感じる、といった声をいただくことが多いのも事実です。

こうした声に応えるため、SplunkはITSIで予測を行うための新しいワークフローを開発しました。このワークフローでは、サービス健全性スコアとKPIの関連性を調べるだけでなく、統計分析を実行してこれらのデータ間に高い相関があるかどうかを確かめることができます。相関が高いかどうかは非常に重要なポイントで、精度よく予測するにはデータ間の強い結びつきが欠かせないのです。

このあたりのことについては、ブログ記事「ITSIの予測をさらにスマートに」で詳しく説明します。

ITSIの予測モデル

アラートをグループ化する際に使えるインテリジェント分析は?

ITSIには機械学習を利用してアラートをグループ化する優れた機能、スマートモードがありますが、多くのお客様はこうしたグループ化機能に加えて、エピソードの定義方法にさらなる柔軟性を求めています。現在、スマートモードではデータのパターンだけでなく、エピソードの集約ポリシーも定義可能です。

最近Splunkで取り上げることが多くなってきたグラフ分析は、ITSIの場合、教師なしコミュニティ検出を利用して「スマートな」エピソードを作成する際に最適です。グラフ分析については、ブログ記事「コミュニティ検出アルゴリズムでITSIのエピソードをさらにスマートに」で詳しく説明します。

ITSIのグラフ可視化

アラートから根本原因を特定するには?

ITSIには、エピソードレビュー、ディープダイブ、さらにはサービスアナライザーによって根本原因を突き止める優れた方法が用意されています。最近では、データポイント間の因果関係を特定する技術である因果推論に関連した開発に取り組みました。ブログ記事「根本原因分析をさらにスマートに:ITSIのKPIから因果関係を特定する」では、因果推論を使ってKPIから根本原因を特定する方法について説明します。

アラートの異常なパターンを見つけるには?

このシリーズで取り上げる最後のトピックは、IT環境の異常なアクティビティの見つけ方です。

アラートやエピソードは、厄介なネットワーク遅延やハードドライブの容量逼迫といった既知のパターンを特定する場合には有効ですが、IT環境全体から届くアラートの中からまったく予想だにしない異常なパターンを見つけ出すのには向いていないことがほとんどです。最後のブログ記事「ITSIのノイズ低減をさらにスマートに」では、異常検出とテキスト分析によって異常なイベントの大量発生を特定する方法について説明します。

まとめ

Smart ITSI Insights App for Splunkとこのブログシリーズでご紹介するテクニックが、ITSI導入環境からのさらなるインサイトの獲得につながれば幸いです。今後は、以上のテクニックをさらに前進させるSMLEの活用方法について詳しくご紹介する予定ですので、そちらの記事もご期待ください。

それではこの辺で失礼します。機械学習でITシステムの円滑な運用を実現しましょう。 

Splunkのメリットをどうぞお試しください。

このブログはこちらの英語ブログの翻訳、沼本 尚明によるレビューです。

Greg is a Machine Learning Architect at Splunk where he helps customers deliver advanced analytics and uncover new ways of insight from their data. Prior to working at Splunk he spent a number of years with Deloitte and before that BAE Systems Detica working as a data scientist. Before getting a proper job he spent way too long at university collecting degrees in maths including a PhD on “Mathematical Analysis of PWM Processes”. When he is not at work he is usually herding his three young lads around while thinking that work is significantly more relaxing than being at home…