主なポイント
エージェンティックAIの時代において、マシンデータは最も戦略的な資産です。しかし、それは適切に活用されて初めて価値を発揮します。多くの組織が「データの混乱」に陥り、ハイブリッド環境やマルチクラウド環境にまたがる分散されたツールやサイロ化された情報に悩まされているのが現状です。
Splunk Data Managementは、こうした課題に対処できるように設計されています。私たちのビジョンは、マシンデータを大規模に統合、最適化、管理できる、シームレスで統一された拡張性の高いエクスペリエンスを提供することです。Splunk Data Managementは、インテリジェントなデータパイプラインを構築することで、生のテレメトリをリアルタイムのインサイトへと変換し、セキュリティ運用、IT運用、ネットワーク保証、オブザーバビリティなどの分野における重要なユースケースを効果的にサポートします。
2028年までに、年間394ゼタバイト(1ゼタバイトは1兆ギガバイトに相当)のデータが生成されると推定されています。データが爆発的に増加する中、課題は単にデータをプラットフォームに取り込むことではなく、それをいかに効率的に行うかということにあります。Splunk管理者やデータアーキテクトは、データフローの可視化の欠如、取り込みの最適化の必要性、複雑なデータ変換要件、そして膨大なデータ量による圧倒的な負荷など、さまざまな課題に絶えず直面しています。
Splunkの一連のデータ管理機能は、まさにこうした課題を解決するために構築されています。Edge ProcessorやIngest Processorなどの強力なツールを使用することで、チームは次のようなメリットを得ることができます。
データ価値とコスト効率の最適化:インテリジェントなフィルタリングとマスキングでパイプラインを効率化します。冗長なログを効率的なメトリクスに変換し、分析に適した価値の高いデータのみをルーティングすることで、ストレージのオーバーヘッドとSplunk Virtual Compute (SVC)の使用量を大幅に削減できます。
ソース側での高度な処理を活用することで強力な基盤を構築できますが、複雑なデータパイプラインの管理には多大な労力を要することも事実です。お客様の業務効率化を支援するため、AIによる自動化を活用して負担の大きい作業をAIに任せる方法をご紹介します。これにより、貴重な時間を有効に活用できるようになります。

Splunk Platformは、市場をリードするデータプラットフォームとしての実績を基盤に、Cisco Data Fabricアーキテクチャを支える存在へと進化しました。このアーキテクチャは、マシンデータをエージェンティックAIの時代に対応したリアルタイムのインテリジェンスに変換する革新的なフレームワークです。
Cisco Data Fabricの一部として、AIを活用した3つの新しいデータ管理機能をアルファ版および限定提供版としてリリースします。これにより、手作業による負担を軽減し、価値実現までの時間を短縮できます。
ログ抽出のために正規表現(regex)を手作業で作成するには、多くの時間がかかります。自動フィールド抽出(AFE)は、AIを活用してパターンを即座に特定し、取り込まれたデータから関連するフィールドを抽出します。ユーザーは「何のデータが必要か」に集中でき、「どのように抽出するか」はAIに任せることができます。手作業での正規表現の作成によるボトルネックを解消することで、データの構造化や分析の準備にかかる時間を大幅に短縮でき、オペレーショナルエクセレンスの実現を加速できます。
ソリューション:Data Management UIでは、AFEがデータソースを分析し、データの取り込みや処理の過程で抽出すべきフィールドを提案します。ユーザーは必要なフィールドを選択するだけで、AIがバックグラウンドで複雑な正規表現ロジックを処理します。
スキルの向上:AFEを利用すると、正規表現に関する高度な知識が不要になり、誰でもすぐにデータ管理を専門家のように扱えるようになります。複雑なパーシングの習得ハードルを下げることで、チームのスキルと生産性が向上し、カスタムのビジネスロジック、フィルタリング、マスキングを迅速に実装できるようになります。
セキュリティとプライバシー:データのセキュリティを確保するため、フィールドの抽出に使用するLLMモデルは社内でホストし、機密性の高いマシンデータはSplunk環境内で保護します。
生データを取り込んでから実用的なインサイトを得るまでのプロセスは、データ正規化の複雑さによって妨げられることがしばしばあります。手作業によるテクノロジーアドオン(TA)の構築、複雑な正規表現の作成、CIM(共通情報モデル)への準拠は、効果的な脅威検出に不可欠ですが、必要なマッピング作業には通常、数日から数週間かかります。このAI支援ワークフローは、手作業でのオンボーディングプロセスを、生データを実用的な構造化データへと変換する、自動化された合理的なエクスペリエンスへと刷新します。データの構造化を自動化することで、脅威をより迅速に特定し、セキュリティ対応を数分で展開できます。
ソリューション:自動スキーマ化機能を備えたガイド付きオンボーディングでは、AIを使用してサンプルデータを分析し、最も適切なCIMデータモデルを自動で提案します。これにより、手作業でのマッピングに煩わされることなく、CIMベースの検出や高性能な分析にデータをすぐに活用できます。
インテリジェントな分析:システムが類似のイベントをクラスタリングし、マッピングを提案し、必要な抽出ルールを自動で生成します。
柔軟な導入:お客様は完全な制御を維持できます。このツールは、サーチ時マッピング用のテクノロジーアドオン(TA)パッケージ、または取り込み時処理用のSPL2パイプラインのいずれかを生成できるため、環境に合わせて最適な戦略を選択することが可能です。
エージェンティックAIの時代において、ガバナンスの効いたAI対応のデータ基盤を持つことは、競争上の必須条件です。これらのツールは、マシンデータに必要なコンテキストを付加することで、自律型エージェントや大規模なリアルタイムの意思決定を可能にします。
AIを活用したデータ管理は、Cisco Data Fabricアーキテクチャの中核をなす要素であり、生データを戦略的インテリジェンスへと変換するプロセスを簡素化することで、エージェント型企業を支援します。その基盤を今日から構築するための方法をご紹介します。
オンボーディングを加速させたい場合は、より包括的なガイド付きオンボーディングエクスペリエンスに参加して、Splunkのエキスパートに直接ご相談ください。
皆さまのフィードバックをお待ちしています。Splunkのエキスパートへのご質問は、コミュニティのSlackチャンネル#dm-pipeline-buildersをご利用ください。Splunkコミュニティのデータ管理に関するブログやお知らせを購読することで、データ管理に関する最新情報を受け取ることもできます。
このブログはこちらの英語ブログの翻訳、井上 綾乃によるレビューです。