リアルタイムITインフラ分析とは、機械学習を使ってログファイルやイベントから継続的にインサイトを抽出することを意味します。
従来、インフラ分析は、ITチームや外部のサービスプロバイダーにより手作業で行われてきました。手作業のインフラ分析では、プロセスやシステムが障害を起こした場合、インフラストラクチャの管理者が実行中のプログラムやログファイルを精査して、セキュリティや帯域幅の問題など、障害原因の手がかりを探し、そのデータを基に適切なソリューションを直感的に判断します。インフラ分析の目的は、過去のイベントの特定の問題を理解し、それに対処することにあり、これは、通常、イベントの解決後、クライアントの影響レポートや根本原因分析の一環として行われます。
最新のインフラストラクチャは、分析を手動で行うにあたり、はるかに大きな課題をもたらします。マイクロサービスベースのアーキテクチャやクラウドへの強い依存によりシステムの分散化が進んでおり、柔軟性と処理速度の向上を目指して設計されているものの、その境界はますます曖昧になっています。その結果、インフラストラクチャは、監視やトラブルシューティングは言うまでもなく、把握することさえ難しいような、不明瞭で流動的なものになりがちです。
しかし、機械学習と自動化のおかげで、最新のインフラストラクチャを維持するためのプロセスはより効率的になり、膨大な量のデータとデータウェアハウスの急激な拡大にもかかわらず、組織はそれらをリアルタイムで把握できるようになりました。イベントの発生後にログを精査してインシデントを理解するのではなく、自己学習型のアルゴリズムで数百万のログをリアルタイムに解析して相関関係を見つけることができるため、ITチームは、セキュリティ侵害やサーバーのオフラインにつながったイベントに事後対応するのではなく、事前にトリガーを特定してイベントを予測することができ、より多くの情報に基づいた意思決定を行うことが可能になります。
ほとんどのITチームは、まず、アップタイム向上のためにインフラ分析を導入します。これは、収益に大きく影響する可能性があるためです。システム障害を検出するだけでなく予測して予防するというインフラ分析の機能は、ビジネスにとってますます不可欠なものとなっています。しかし、リアルタイムインフラ分析のユースケースは、サービススパイクの予測やリアルタイムの要求に合わせたリソース割り当ての自動調整に至るまで、拡大し続けています。インフラ分析を使ってインフラストラクチャの設計自体を改善することさえできます。