パートナー

05月 14日, 2026

6 分程度

Splunk Federated Search for Amazon S3を使ったAWS WAFログのサーチ：パート2

Travis Kane

このブログ記事はパート1からの続きです。まだお読みになっていない方は、そちらからご覧ください。

2部構成のブログシリーズのパート2では、AWS WAFログをサーチするためのSplunk Federated Search for Amazon S3の設定方法をご説明します。パート1では、Splunkの設定前に行う必要のあるAWSの設定について説明しました。その手順を完了したものとして、続きの手順をご案内します。

AWS WAFをサーチするためのSplunk FS-S3の設定

Splunk統合サーチの設定は大きく2つに分けられます。

統合プロバイダーの作成
統合インデックスの作成

統合プロバイダーの作成

Splunkコンソールから、[Settings]、[Federation]の順に移動します。
[Federation]ページで、[Add Federated Provider]ボタンをクリックします。
[Amazon S3]を選択して、[Next]をクリックします。

Add Federated Provider画面

4. 次のページで以下の項目を入力します。

統合プロバイダーの名前：たとえば「federated_search_s3_provider」などです。
AWSアカウントID：データとGlueがあるAWSアカウントのIDです。
リージョン：Splunk Cloudの導入先に基づいてすでに入力されています。
AWS情報：次の3つの項目は、AWS Glueテーブルの情報画面で確認できます(パート1の最後の図を参照)。
- Glueデータベース名
- Glueテーブル名
- Amazon S3の場所

データを入力した画面の例を次に示します。

Add Amazon S3 Provider画面

5. すべての設定を入力したら、[Generate Policy]ボタンをクリックします。

6. [Glue Data Catalog resource policy]に表示されたポリシーをコピーします。

7. Glueのタブに戻り、左側のメニューで[Catalog Settings]セクションを選択します。

警告：ここにポリシーがすでに入力されている場合は、十分に注意してポリシーを結合してください。

8. Splunkからコピーしたポリシーを貼り付けるか、既存のポリシーに結合して、[保存]をクリックします。

9. Splunkの統合プロバイダー画面に戻り、S3バケットポリシーを展開して、コピーします。

10. AWS WAFログを設定するために開いていたS3バケットのタブに移動します。最上位のフォルダーに戻り、[アクセス許可]タブを選択します。

警告：ここにもS3バケットのポリシーがすでに入力されていることがあります。十分に注意して、Splunkからコピーしたポリシーを既存のポリシーに結合してください。

11. S3バケットポリシーを貼り付けるか、既存のポリシーに結合します。入力内容を確認して[保存]をクリックし、Splunkの画面に戻ります。

12. Splunkの権限の設定が完了したので、両方の同意ボタンにチェックマークを付けて、[Save]をクリックします。

同意ボタン

これで、統合プロバイダーの作成は完了です。続いて、AWS WAFログの統合インデックスを作成します。

統合インデックスの設定

Splunkで[Federated Indexes]タブを選択します。
[Add federated index]をクリックし、[For S3 provider]ボタンをクリックします。
インデックスを作成するための以下のフィールドを入力します。
- Federated index name：任意のインデックス名を入力します(「aws_waf_logs_index」など)。
- Federated Provider：先ほど新しく作成した統合プロバイダーを選択します。
- Dataset type：「(customer created)」が付いたタイプが選択されていることを確認します。
- Dataset name：パート1で作成したGlueテーブル名を選択します(「waf-logs-ddl」など)。
[Time settings]の以下のフィールドを入力します。
- Time settings not required：チェックを外したままにします。
- Time field：「timestamp」と入力します(これはAWS WAFログのtimestampフィールドを示します)。
- Time format：「%UT%3Q」と入力します(これはミリ秒形式のUNIX時間を示します)。

フィールドを入力した画面の例を次に示します。

Create a Federated Index画面

入力内容を確認して、[Save]をクリックします。

これで、統合プロバイダーと統合インデックスの作成が完了しました。統合サーチが正しく機能するかどうか確認してみましょう！

AWS WAFログに対する基本的なSDSELECTコマンドの実行

Splunkコンソールから、[Apps]、[Search and Reporting]の順に移動します。

ここで、Splunkサーチ処理言語(SPL)を実行できます。
サーチバーから、シンプルなサーチを実行してみます。次のSPLをコピーしてサーチバーに貼り付け、サーチボタンをクリックします。

| sdselect * from federated:aws_waf_logs_index limit 100

注：権限が正しく反映されるまでに1～2分かかることがあります。1～2分待てば、次のような結果が表示されるはずです。

サーチ結果

これで完成です！SplunkとAWS間の接続を設定して、AWS WAFログをインプレースサーチできるようになりました。

ブログ記事を終える前に、「それで、どう使えばいいの？」という疑問に簡単にお答えしましょう。

準備完了。それで、どう使えばいいの？

統合サーチについてSplunkユーザーと話をすると、最大の課題は、私が「ラーニングパスのフェーズ3」と呼んでいる部分であることがよくあります。

フェーズ1：どうすれば動くのか
フェーズ2：データを入れてみた
フェーズ3：実際に使ってみよう

統合サーチが何に役立つかを考えるときは、そもそもこの機能が何のために存在するのか、その主な理由を押さえておくことが大切です。

統合サーチは、データ分析によるリアルタイムの脅威ハンティングのために作られたのではありません。稀にまたはアドホックで実行するデータサーチで使うことを目的としています。

統合サーチの一般的なユースケースをご紹介する前に、統合サーチの課金モデルについて簡単にご説明します。

Splunk統合サーチの課金モデル

Splunk統合サーチでは、「スキャンデータ単位」と呼ばれる課金モデルが採用されています。これはSplunk独自の課金モデルというわけではなく、この市場で広く使用されています。基本的には、一定のデータ量を事前に購入し、所定のテラバイト数を使い切ったら追加購入が必要になる仕組みです(プリペイド携帯プランのようなものです)。

データに対してサーチを実行するたびに、Amazon S3バケット内でスキャンしたデータ量に基づいて、事前購入したデータ量が消費されます。課金対象が、返されたデータではなく、スキャンしたデータであることに注意してください。つまり、S3バケット全体を対象とする非効率なサーチを実行すると、ライセンスを大量に消費することになります。このブログ記事では、サーチを効率的に行う方法やサーチの最適化については扱いません(パート1で触れたコースで取り上げる予定です！)。

ライセンスモデルについて理解したところで、本題の「どう使えばいいのか」の例となるユースケースをご紹介しましょう。

統合サーチのユースケース

統合サーチの一般的なユースケースの中で、「どう使えばいいのか」を深く理解するために特に役立つユースケースが3つあります。

ユースケース1：フォレンジック調査

脅威ハンティングとフォレンジック調査の違いを考えてみましょう。脅威ハンティングでは、フラグを立てるべき異常な行動を継続的に追跡します。そして、脅威ハンティングで見つかった脅威を調べるのが、フォレンジック調査です。

フォレンジック調査では、通常、対象を特定の時点に絞り込みます。たとえば、今週、今月、今日などです。このタイプのサーチでは、対象が非常に具体的で限定されているため、統合サーチが効果的です。これはインプレースサーチに適した2つの主要な条件を満たしています。

サーチの頻度が低い
サーチ対象の時間枠が限定されている

これにより、特定時点までのデータ(とライセンス)を使用して、非常に効率的にサーチできます。

ユースケース2：履歴分析

統合サーチを使って、過去のデータに関する統計を生成できます。たとえば、Amazon S3に非常に長い期間データを保存している場合、そのデータのサブセットを時系列で抽出してレポートを作成し、特定の情報の傾向を把握できます。

これもまた素晴らしく効率的な方法です。そのデータをずっとデータプラットフォームに保持していたわけではないにもかかわらず、このようなことが可能です。ユースケース1で説明したようなランダムなサーチではないかもしれませんが、データのサブセットに対して低頻度で実行するため、依然として非常に効率的です。

ユースケース3：データの補強

これも一般的で優れたユースケースです。たとえば、履歴目的でAmazon S3に大量のデータセットを保存していて、そのデータを週次や月次のレポートに詳細として補足したいことがあるかもしれません。

その場合は、統合サーチが最適です。サーチを実行して、返された結果を既存のレポートやサーチ結果に追加したり、レポートや分析に追加データとして組み込んで傾向などを示したりできます。

まとめ

このブログのパート1とパート2で説明した内容の要点は以下のとおりです。

SplunkがFederated Search for Amazon S3などの統合サーチ機能を開発した理由
Federated Search for Amazon S3の設定方法
組織でFederated Search for Amazon S3を活用するヒント

このブログがお役に立てば幸いです。また次のブログでお会いしましょう！

このブログはこちらの英語ブログの翻訳、森本寛之によるレビューです。

Travis Kane

Trav aka T-REX has over 25 years of working in the IT industry. With lots of different roles from architect to a company director, Trav has almost seen it all!

For the past four years, Trav has been working in the partner business for Splunk helping manage the Technical Relationship between AWS and Splunk for APAC.

Trav has helped many customers across the region realize the full potential that both AWS and Splunk can bring to customer challenges.

With a mindset of sharing, Trav has also authored a number of technical whitepapers and thought leadership pieces for Splunk and delivered a Splunk keynote at Splunk Live Melbourne.

パートナー 5 分程度

パートナーこそが戦略の要：Cisco Live 2025以降の機運の高まりとチャンスの到来

Cisco Live 2025で明らかになったイノベーションと革新的なパートナーソリューションについて詳しく解説します。

パートナー 4 分程度

Splunk Victoria Experience on Google Cloudが登場：スピード、可視性、レジリエンスが向上

Splunk VE (Victoria Experience)がGoogle Cloudで利用可能になりました。これにより、組織や管理者の皆様は、透明性、応答性、柔軟性がさらに向上したSplunk Cloud Platformをご利用いただけます。

パートナー 4 分程度

SAPシステムと周辺システムを包括的に監視するSplunk

SplunkはSAPシステムや周辺システムを包括的かつリアルタイムに可視化しセキュリティとオブザーバビリティのパフォーマンスを最大限に高めるソリューション。RISE with SAPのようなSAP社が提供するSaaS/PaaS環境を利用したり、既存のオンプレミスとは異なる環境でSAPを利用するケースにも有効。

Splunkについて

世界をリードする多くの企業が、デジタルレジリエンスを継続的に強化するために、シスコの一員であるSplunkを利用しています。業界屈指のAIを活用したセキュリティとオブザーバビリティの統合プラットフォームです。

Splunkの実績あるセキュリティ製品とオブザーバビリティ製品は、あらゆる規模の複雑なデジタル環境のセキュリティと信頼性を向上させるソリューションとして、お客様から高い評価を得ています。

Splunkの詳細はこちら