AIOpsとは、人工知能(AI)や機械学習(ML)にIT業務で利用するビッグデータを学習させることで、IT業務の自動化、効率化を図るITの運用手法を指します。AIOpsを導入することで、大量のネットワークデータやマシンデータを自動的に分析し、パターンを検出することが可能です。また、既存の問題の原因を特定したり、将来の問題を予測できるので、様々な脅威に対する予防や運用監視の効率化に役立ちます。
この言葉は、2016年にガートナー社によって提唱されました。ガートナー社は、『ガートナー社によるAIOpsプラットフォームマーケットガイド』の中で、AIOpsプラットフォームを、「ビッグデータと人工知能 (AI) または機械学習(ML)機能を組み合わせて、可用性やパフォーマンスの監視、イベントの相関付けと分析、ITサービスの管理と自動化といったIT運用のさまざまなプロセスやタスクを改善または部分的に刷新するようなソフトウェアシステム」と説明しています。
運用管理で人工知能をどのように使用するか?
AIOpsの目的は、AIの特徴である処理の速さと正確さをIT運用に取り入れることです。ネットワークの拡大と複雑化が進む今日、IT運用管理は一段と難しいものになってきています。従来の運用管理ツールや手法ではもはや、多様化した複雑なネットワーク内のさまざまなソースから発生する未曾有の量のデータに対応できません。AIOpsは、以下の機能によってこの課題を解消します。
機械学習とビッグデータを活用するAIプラットフォームは、ITがより大きなビジネス価値を提供する一助となります。
ガートナー社によると、AIOpsプラットフォームとは、ビッグデータと機械学習を組み合わせて、生成されるデータをスケーラブルに取り込み、分析することにより、IT運用を支援するシステムを指します。AIOpsプラットフォームでは、複数のデータソース、データ収集方法、分析技法、表示方法を同時に使用できます。
ガートナー社は、『AIOpsプラットフォームのマーケットガイド』の中で、「AIOpsプラットフォームは、監視ツールにAIOps機能を組み込んだよりも多くの重要機能を提供する」と述べています。真のAIOpsプラットフォームは、「ビッグデータと機械学習機能を組み合わせて、IT環境で生成されるかつてない量、多様性、速度のデータをスケーラブルに取り込み、分析することにより、あらゆる主要なIT運用業務を支援できる」システムだと説明しています。
AIOpsプラットフォームには、保存されたデータの分析と、データの取り込み時点でのリアルタイム分析の両方の機能が求められます。
ガートナー社の定義によるAIOpsプラットフォームの主要機能は以下のとおりです。
ガートナー社によると、AIOpsの主なユースケースには以下の5つがあります。それぞれについて以下で詳しく説明します。
AIOpsのビジネス面での主なメリットとは
AIOpsでIT運用業務を自動化し、AIを活用してシステムのパフォーマンスを向上させることで、企業はビジネス面で大きなメリットを得ることができます。たとえば、以下のメリットがあります。
IT基盤とアプリケーションのパフォーマンス改善により、AIOpsは、ビジネスの成功を評価するKPIを高めます。
IT運用に関する課題の多くはすべての業界に共通であり、AIOpsはその解消に役立ちます。もちろん、医療、小売、製造、金融サービスなど、業界によって特に直面しやすい課題や重要性の高い課題もあります。
AIOpsでIT運用業務を自動化し、AIを活用してシステムのパフォーマンスを向上させることで、企業はビジネス面で大きなメリットを得ることができます。たとえば、以下のメリットがあります。
小売業向けITでのAIOpsの用途とは:
自社に最適なAIOpsツールや製品を選ぶには?
AIOps製品の選定で注意したいのは、従来の各種IT運用ツールをまとめて基本的なAI機能を付け加えたものを「AIOpsプラットフォーム」と呼んでいるベンダーがあることです。真のAIOpsプラットフォームは、単なるツールの寄せ集めではありません。プラットフォームの選択が導入の成功を左右するため、この点はよく理解しておくことが重要です。ガートナー社は選定について、「データの取り込み、保存、アクセス機能をその他のAIOpsコンポーネントとは別に実装できるベンダーを優先する」ことを推奨しています。
また、機能一覧以外に、成功事例やAIOpsのユースケースを調べることも大切です。候補のAIOpsプラットフォームが自社のニーズに合っているかどうかを確認する最も簡単な方法は、自社と似たビジネス課題を抱える企業のAIOps成功事例を確かめることです。ベンダーのWebサイトで成功事例を探したり、そのベンダーを推薦する顧客に問い合わせたりしてみましょう。AIOpsツールやプラットフォームのメリットを強調していても、その実例を紹介していないベンダーは、避けた方が無難です。
AIOpsを使い始める最善の方法は、段階的に導入することです。ITドメインをデータソースごとに再編して、スモールスタートで着手するのがベストプラクティスです。各種のソースから取り込まれる大規模で持続的なデータセットの処理方法を学んでIT運用チームに、AIOpsでのビッグデータの扱いに慣れてもらいましょう。履歴データのデータセットから始めて、新しいデータソースを徐々に追加しながら、適用範囲を広げていくことをお勧めします。
まずはデータの取り込みに重点を置く:AIOpsを活用するには、マシンデータやメトリクスのような非構造化データから、情報補強のためのリレーショナルデータまで、あらゆるタイプのデータにアクセスする必要があります。異なるタイプのデータを取り込むことで、サイロを横断した包括的な視点を確立し、状況やデータタイプに応じた有意義な対応を取ることができるようになります。
取り込みと分析をすばやく効果的に行うには、いきなりすべてのデータを対象にしないことです。まずは、過去の未加工 (Raw) のマシンデータやメトリクスデータを取り込み、分析して、基本を理解し、クラスタリングアルゴリズムとクラスター分析を用いて、トレンドやパターンを特定してみましょう。リアルタイム検出を実現したいならば、Rawデータがデータタイプとして最適です。その後、ストリーミングデータを分析対象に加えて機械学習によるAIを取り入れれば、検出したパターンとどのように適合するかを調べ、自動化を実現して、最終的には予測分析につなげることができます。
予測分析について詳しくは、『IT のための AI:予測分析による障害防止』をご覧ください。
できるだけ多くのタイプのデータを取り込んで分析する:AIOpsの導入当初は、履歴データが非常に役立ちます。システムの過去の状態を分析し、理解すれば、現在の状態と相関付けて状況を把握できます。
それを実現するには、履歴データとストリーミングデータを広範囲に取り込み、これらのデータへのアクセスを可能にする必要があります。ログ、メトリクス、テキスト、ワイヤー、ソーシャルメディアなど、どのタイプのデータを取り込むかは、解決したい課題によります。たとえば、インフラストラクチャの容量を監視したい場合は、そのメトリクスデータを取り込み、カスタマーエクスペリエンスを向上させたい場合は、アプリケーションログを取り込みます。
メトリクス分析について詳しくは、メトリクス分析をやってみた :「IT運用者目線で分析」シリーズをご覧ください。
AIOpsプラットフォームの多くはもともと、単一のデータソースをターゲットにしていました。データタイプを1つに限定すると、IT管理者とアルゴリズムのどちらが分析するにしても、システムの動作について得られるインサイトも限定されます。そのため、AIOpsプラットフォームを選定するときは、複数のソースからデータを取り込んで分析できるかどうかを確認することをお勧めします。
すべてを一度にやろうとしない:まずは、優先度が最も高い課題について、その根本原因を見つけることに集中しましょう。その後、データの監視を開始します。それからがAIの出番です。さらにそこでも、段階を踏むことが重要です。
効率的なインシデント調査について詳しくは、Splunkを使った超速インシデントレスポンスをご覧ください。
導入するなら今
ITやネットワークの担当者であれば、データは企業にとって最も重要な資産であり、ビッグデータは世界を一変させるほどの可能性を持つという言葉を何度も聞いているでしょう。AIは革新的なテクノロジーであり、すでに普及段階にあります。また、AIOpsは、AIやビッグデータに対する大きな期待を現実のものにするための具体的な方法を提供します。セキュリティの強化から、業務の効率化、生産性向上まで、AIOpsは、IT運用を成長、発展させ、将来の課題に対応できる体制を整えて、IT部門の役割を事業拡大の戦略的促進要因として定着させるための実践的な手段を目の前に提示しているのです。