IT部門におけるAIの必要性
ITOpsやDevOps、そしてSecOpsやNetOpsに至るまで、IT部門は事後対応の悪循環に陥っています。インシデントや障害を後追いし、ユーザーや顧客に気付かれる前にサービスを復旧しようとしていますが、予定外のダウンタイムにより企業は数百万ドルの損害を被っています。
持続可能ではない現行のITアプローチ
しかも、このアプローチはもはや持続可能ではありません。その理由は以下のとおりです。
- 多額の投資にもかかわらず、インシデントや障害が依然として多発しています。
- IT環境はかつてないほど変化し、複雑化しています。経営幹部やリーダーはレジリエンスを、顧客や従業員は24時間365日の常時稼働を求めています。こうしたことがリアルタイムのトラブルシューティングにおけるプレッシャーを高めています。
- 生成AIシステムやエージェンティックAIシステムの急速な導入により、想定されていなかった予測不能な挙動が生じ、いわゆる「未知の未知」という厄介な事態を招いています。
- 超大規模化やAIドリブンのアプリケーションによって、IT運用データの量がますます急増しています。
かつてないほど高まるデジタルレジリエンスの必要性
複雑なデジタルシステムにおいて、システムの信頼性と高いパフォーマンスを維持することは容易ではありません。予定外のダウンタイムによるコストは、金銭面だけでなく、評判や信頼の喪失という面でも増加の一途をたどっています。また、パフォーマンスの低下がユーザーの不満やアプリ離脱につながることも大きな損失です。
現在のツールセットとワークフローは、半自動化されたものであっても、超大規模AIシステムの処理速度に対応することはできません。解決策は明らかです。IT部門がこの状況を解消するには、AIが必要なのです。
CIOが直面している5つの主な課題
ITチームは依然として、以下の5つの課題に直面しています。
- 後追いの対応:IT部門は、損害が発生してからインシデントを後追いするというやり方から抜け出せずにいます。
- 多すぎるデータ:チームは、自分たちで処理できる以上のデータを収集しています。生の運用データは、不完全で構造化されていないことが多く、利用できない場合もあります。
- データのサイロ化:運用データのサイロ化が進んでいます。多くのチームがデータのコピーを作成していますが、コピーされたデータは時間の経過とともに古くなり、インサイトの信頼性は低下します。
- 盲点:一方で、チームは依然として盲点に悩まされています。データのサイロ化、フィルタリング、ツールの混在のいずれが原因であっても、見えないものからインサイトを得ることはできません。
- 「未知の未知」の増加:AIシステムと分散アーキテクチャが相互に作用する中で、複雑な障害が新たに発生しています。
つまり、AIの助けを借りなければ、このような課題を解決することはできません。
データこそが基盤
適切なデータがなければ、最先端のAIでもインサイトを提供することはできません。企業が直面している最大の課題の1つは、インシデントを効果的に診断し、防止できるだけの質と量を備えたデータを入手することです。
デジタルレジリエンスを実現するには、あらゆる環境を横断的かつ総合的にすべて可視化できる必要があります。つまり、ネットワーク、インフラ、サーバー、データベース、API、そしてアプリケーションレベルのデータなどです。しかも、データがクリーンで、AIを活用できる状態になっている必要があります。
Splunk AI Toolkitが提供する価値
AI Toolkitは、後追いの「火消し」対応から先回りでインテリジェントな運用へのシフトに欠かせない基盤構築のためのツールキットです。ノーコードにもプロコードにも対応し、あらゆるユーザーが検出、説明、自動化の機能を利用して基盤を構築できるプラットフォームなのです。
すべてのソリューションが、MCPサーバーとエンドポイント連携を通じて外部データソースおよびランタイムに接続します。データは元の場所に留まり、データのセキュリティおよびガバナンスが確保されます。
1. 先回りで予測的な運用(以前のMachine Learning Toolkitから引き継がれた機能)
Toolkitを利用すると、優れた稼働率とセキュリティを実現するモデルを構築し、デプロイできます。
- インシデントを予測:カスタムの高度なAI予測モデルや機械学習予測モデルを構築して、需要を予測したり異常を検出したりできます。障害やセキュリティインシデントを発生前に予測することも可能です。
- 見えないものを発見:ログの奥深くに埋もれた「未知の未知」を見つけ出します。
- スタック全体を修復:カスタムのAIモデルと機械学習モデルを管理することで、推論、インサイト獲得、アクション実行が可能なカスタムエージェントを構築し、インフラからアプリケーションレベルに至るフェデレーション(分散連携)型のテクノロジースタック全体で問題を修正できます。
2. AIの民主化と効率化
このプラットフォームは、あらゆるタイプのユーザーの生産性を大幅に向上させます。
- すべてのユーザーを支援:AI Toolkitは、Splunkのさまざまなユーザー層向けに機械学習とAIを民主化します。ユーザーは使い慣れた検索インターフェイスから強力なAIと機械学習の機能を利用できます。ノーコードにもプロコードにも対応し、あらゆるユーザーが検出、説明、自動化の機能を利用して基盤を構築できるプラットフォームであり、フェデレーション(分散連携)型のエンタープライズスタック全体でSplunkのデータを基に推論を行い、アクションを実行するカスタムAIソリューションの構築が可能になります。
- 柔軟なエージェントを構築:直感的なノーコードツールで迅速にプロトタイプを作成することも、フルコード環境でエンタープライズクラスのカスタムエージェントを開発することも可能です。
- 複雑なデータを簡素化:生成AIを利用して、複雑なイベントデータを実用的なサマリーやレポートに変換できます。
3. エンタープライズクラスのアーキテクチャと信頼性
AI Toolkitは、大企業の厳しい要件に合わせて設計されています。
- セキュリティとガバナンス:あらゆるAIイノベーションが、すでに利用している安全でガバナンスの効いたエンタープライズクラスのSplunk環境内で提供されます。
- 拡張性とパフォーマンス:この新しいツールキットは、GPUとモデル並列処理を利用し、大規模なデータセットにまつわる制約を取り除き、エンタープライズ規模でモデルを実行することで、パフォーマンスを向上させます。
- モデルの柔軟性(LLM):AIが出力したインサイトに対する根拠付けを非常に柔軟に行えます。
- Splunkがホストする各種モデル:イベントの要約や自然言語による説明を生成するために、GPT OSSやLlama 3.1のバリアントなど、審査とテストが完了した安全なモデルを利用できます。
- サードパーティとBYOM:サードパーティのLLMと統合することも、BYOM (モデルの持ち込み)オプションを利用して企業固有のニーズに合わせて最大限にカスタマイズすることもできます。
- RAGインテグレーションの追加:企業のナレッジに基づいて出力が生成されるようにすることで、ハルシネーション(幻覚)を低減しながら精度を向上させます。
データを移動するのではなく、データがある場所でAIを活用
IT部門のためのAI運用において、Splunkが持つ独自の強みの1つはデータ管理です。Splunk AI Toolkitにより、データがある場所でAIを活用することで、大規模なデータ移動にまつわる問題を解決できます。大量のデータセットをネットワーク経由でAIシステムに移動するというやり方では、コストと時間がかかり、リスクも生まれますが、Splunk AI Toolkitは、データがある場所でAIを活用するというアプローチを採用しています。
このアーキテクチャにより、レイテンシーとコストを大幅に削減しながら、リアルタイムのインサイトを獲得し、意思決定を迅速化し、ガバナンスを強化することが可能になります。これこそが、Splunkがエンタープライズ規模のデジタルレジリエンスを実現している仕組みなのです。
デジタルレジリエンスの未来
ITがより複雑になり、システムがより自律的になる中、今後は予測インテリジェンスが次世代のデジタルレジリエンスを決定づけるようになるでしょう。
Splunk AI Toolkitを利用すれば、「火消し」の対応に追われるのではなく、ユーザーに影響が及ぶ前にITチームがインシデントを予測し防止できるようになります。しかも、これを迅速かつ確実、そして大規模に行えます。
一瞬の判断が重要な時代にあって、予測的な運用は競争優位性をもたらすだけではありません。生き残るための戦略なのです。
Splunk AI Toolkitの詳細
このブログはこちらの英語ブログの翻訳、阿部 浩人によるレビューです。