05月 26日, 2026

21 分程度

発見から防御へ：ローカルLLMを検知してシャドーAIに対処

Rod Soto

AIの進化と普及は、優先順位の転換や新技術への適応と受け入れ、そしてそれらを効果的に活用する必要性など、多くの課題をもたらしています。また、こうした技術の導入や利用に伴い、さまざまな懸念も顕在化しています。その1つが、これらのモデルが稼働するクラウド上の処理基盤に機密情報が送信または開示されるリスクです。さらに、これらのモデルは利用されるだけで性能が向上するため、結果的にベンダーが独自のアプリケーションや競合製品を開発することにつながりかねません。

多くの企業は、生成AI、特に大規模言語モデル(LLM)を導入する際に、「ソブリンAI」という方向性に沿ったアプローチを採用しています。これは、モデルをローカル環境やプライベートクラウドにデプロイする手法です。データとモデルを分離し、自社固有のデータを用いて微調整やトレーニングを行うことで、パブリッククラウドやインターネットとのやり取りを避け、安全性を確保します。これは同時に、複数のクライアントとリソースを共有し、それに伴うさまざまな影響があるパブリックプロバイダーを利用する場合と比較して、コスト削減と高速なアクセスを実現できることも意味します。

デスクトップやノートPCに大規模モデルの軽量版をデプロイできる点も、現在のAI技術が持つ大きな利点であり特徴です。しかし、デスクトップやモバイルPCなどの環境において、新しい技術を早く習得したいという焦りから、ローカルでモデルを実行できるさまざまなフレームワークを急いでダウンロードし、導入してしまうユーザーも少なくありません。こうした行為は、これらのアプリケーションが実行される組織に対して、多くのリスクをもたらす可能性があります。

LM Studio

このブログでは、Splunkの脅威調査チーム(STRT)が、インターネットからダウンロード可能な複数の公開アプリケーションを取り上げます。これらはローカルのデスクトップやモバイルPCにインストールされ、ローカルLLMの実行やクラウドLLMへの接続を可能にする一方で、組織による認可、制御、可視化を回避する可能性があります。これは「シャドーAI」として知られる現象です。さらに、多くの攻撃キャンペーンや新たなペイロードがいかにこの状況を悪用しているかを解説し、この現象を検知して防御する方法についても詳しく説明します。

ローカルAIフレームワーク

ローカルやクラウドベースのLLMを実行できるフレームワークの入手は、決して難しくありません。インターネットで検索するか、PerplexityやCopilotといったLLMベースの検索ツールを使用して、ダウンロードするだけで済みます。また、ローカルで実行する場合、GPUすら必要としない非常に小さなモデルもあるため、ハイスペックなハードウェアは必要ありません。16GB以上のRAM、現行のプロセッサ、十分なストレージ容量を持つSSDを搭載したノートパソコンがあれば、すぐに始めることができます。

モデルの精度や重みを削減する量子化というプロセスにより、モデルのサイズとVRAMの使用量を大幅に抑えることが可能になりました。これにより、モデルをコンシューマー向けの一般的なハードウェアで動作させることができます。LLMの量子化にはいくつかの手法がありますが、これらを知っておくことは重要です。なぜなら、ダウンロードしたモデルの拡張子にその手法が反映されるからです。以下にその例をご紹介します。

GGUF (Georgi Gerganov Universal Format)

モデルフォーマットにおける「MP3」とも呼ばれており、互換性が高く柔軟に利用できます。CPUとGPUのいずれか、あるいはその両方で動作しますが、GPU専用のフォーマットに比べると低速になる傾向にあります。このフォーマットは、OllamaやLM Studioといったツールで採用されています。ローカルLLMを実行するフレームワークとして、これら2つが最も広く使われているのには、明確な理由があります。

GPTQ (Generative Pre-trained Transformer Quantization)

これは、NVIDIA製GPUでの実行に最適化された、より高度な量子化手法です。実行速度、圧縮率、精度のすべてにおいて、優れたパフォーマンスを発揮する傾向にあります。ただし、GPU専用であることに加え、セットアップがやや難しいという側面もあります。

AWQ (Activation aware Weight Quantization)

GPTQに匹敵する、より新しく高度な量子化フォーマットです。速度と精度の双方が向上しているのが特徴ですが、NVIDIA製GPU専用となります。

これらのモデル量子化フォーマットの一部は、GGUFという拡張子で識別できることがわかります。この拡張子は、以下のようなローカルLLMフレームワークの存在を検知する手がかりとしても利用できます。

このブログの執筆時点で、最も広く普及し、利用可能なフレームワークは以下のとおりです。

Ollama

Ollamaは、Llama 3やMistralといった強力なオープンソースの大規模言語モデルをPCにダウンロードして実行できる、無料で使いやすいツールです。

Ollama

Ollamaは、デスクトップ環境や企業のローカル環境での導入において、最も広く利用されているフレームワークです。STRTでは、これまでにもOllamaフレームワークについて詳しく取り上げてきました。

LM Studio

LM Studioは、ローカルLLMをPCにダウンロードして実行するための、洗練された使いやすいGUIを備えた無料のデスクトップアプリケーションです。モデルブラウザとチャットウィンドウが内蔵されているため、コマンドラインを介することなく、誰でも簡単にさまざまなモデルを試すことができます。

LM Studio

Ollamaと比較すると、LM Studioは一般ユーザーや初心者向けのツールと言えます。その洗練されたGUIにより、セットアップや操作がOllamaよりも容易で、より使いやすくなっています。また、Ollamaとは異なり、LM Studioはクローズドソースである点も特徴です。上の図のように、モデルを直接検索してダウンロードし、そのままインストールできます。さらに、OpenAIなどのクラウドプロバイダーに接続することもできます。

GPT4All

ローカルLLMを誰もが利用できるようにした、先駆的なプロジェクトの1つです。プライバシーに配慮し、信頼性の高いCPUパフォーマンスを備えたツールで、多くのユーザーに支持されています。初心者やプライバシーを重視するユーザーを主なターゲットとしており、強力なGPUを搭載していない古いハードウェアでも動作させることができます。

GPT4All

GPT4Allでは、モデルのダウンロードは可能ですが、ローカルファーストのプライバシー設計のため、外部モデルに接続することはできません。

Llama.cpp：アプリケーションではなく、その中核を担うエンジン

Llama.cppは、大規模言語モデルを実行するために開発された高性能なC++ライブラリです。CPUやGPUを搭載した一般的なコンシューマー向けハードウェアでも非常に効率的に動作します。当初はMeta社のLLaMAモデルを実行するために開発されました。このエンジンはコマンドラインで操作する仕様で、GUIを備えておらず、主にパワーユーザーを対象としています。

このエンジンは量子化されたモデルファイル(GGUFフォーマット)を読み込み、可能な限り高速に実行します。Llama.cppは、LM Studioに組み込まれているほか、Ollamaのフレームワーク内でも利用されています。いわば、OllamaやLM Studioは、ローカルLLMを実行するメインエンジンであるLlama.cppのラッパーのような存在です。Llama.cppは単体で動作させることもできますが、双方のツールにとって基盤となるエンジンの役割を果たしています。どちらのツールでGGUFモデルを実行する場合も、技術的にはLlama.cppを使用していることになりますが、より使いやすい形で操作できるようになっています。

その他の注目すべきフレームワーク

ローカルLLMツールの世界には、使いやすいアプリケーションから強力なバックエンドサービスまで、多様なニーズに応える選択肢があります。洗練されたオープンソースのデスクトップクライアントを求めるユーザーにとって、クリーンなGUIを備えたJan.aiは、LM Studioに代わる魅力的な選択肢となります。対照的に、開発者はLocalAIのようなソリューションを好む傾向があります。LocalAIは汎用性の高いセルフホスト型のAPIサーバーとして動作し、OpenAI APIをそのまま置き換えて利用できます。

また、クリエイティブな用途に特化したKoboldCppは、ロールプレイや共同執筆に最適化された高性能なWeb UIとして注目されており、物語の生成を細かく制御できる機能を備えています。さらに、こうした確立されたツールに並び、Nutstudioのようなニッチなプロジェクトや新興のプロジェクトも、ローカルLLMツールのエコシステムの幅を広げており、それぞれが特定のユーザーワークフローや実験的な機能の提供を目的としています。

ローカルLLMツール1

ローカルLLMツール2

ここまで、最も一般的で使いやすいローカルLLMフレームワークをいくつか紹介してきました。詳細は、こちらからご確認いただけます。

ローカルLLMとシャドーAIの関係

前述のとおり、IT部門やセキュリティ部門の許可なくAIツール、モデル、APIを利用することはシャドーAIと呼ばれます。ここまで各フレームワークについて解説してきたように、これらは個々のユーザーやチームによって容易にインストールされ、企業の監視や調達、ガバナンスのプロセスを回避する形で利用される可能性があります。従業員は生産性の向上や試験的な利用、業務の自動化のためにこれらのツールを導入することがありますが、多くの場合、そのリスクやコンプライアンス上の影響を十分に認識していません。

シャドーAIに伴うリスクには、以下のようなものがあります。

データ漏えい：機密データが不注意によって外部のAIプラットフォームにさらされ、プライバシーの侵害や知的財産の損失を招くリスクがあります。
コンプライアンス違反：無許可でAIツールを使用することで、GDPR、HIPAA、PCI DSSなどの規制に違反し、法的罰則を招く可能性があります。
セキュリティの脆弱性：未承認のAIソリューションには修正プログラムが適用されていない欠陥が含まれている可能性があり、サイバー攻撃のリスクを高め、攻撃対象領域を拡大する恐れがあります。
監査証跡の欠如：シャドーAIでは責任の所在や追跡可能性が担保されないため、意思決定の経緯を把握したり、インシデントを調査したりするのが困難になります。
不整合またはバイアスのある出力：シャドーAIによる結果は信頼性に欠けることが多く、ビジネス上の意思決定に影響を及ぼしたり、データ主導型プロセスへの信頼を損なったりする可能性があります。
モデレートされていないモデルは、さまざまな場所からダウンロードでき、サイバー攻撃の手順や有害な活動に関する指示といった悪意ある出力を、ガードレールなどの安全対策なしで生成する可能性があります。

牙を剥き始めたシャドーAI

現在、多くの攻撃キャンペーンやマルウェアが、シャドーAIやローカルLLMの導入環境を標的にし、管理の行き届かない未承認のモデルを悪意ある目的のために利用しています。以下にその例をご紹介します。

Ray AIフレームワークを狙った攻撃キャンペーン(クリプトジャッキング)

分散処理によく用いられるオープンソースのAIフレームワーク「Ray」の脆弱性を悪用した、進行中のクリプトマイナー攻撃が確認されています。攻撃者はRay AIフレームワークの設定不備、特にインターネットに公開された環境を悪用していました。

この攻撃は、AIインフラそのものが標的となっている実態を浮き彫りにしています。AIモデルが企業のデータベースやその他の内部システムと連携しているケースでは、そのリスクを正しく理解しておくことが不可欠です。

PromptLockランサムウェア

PromptLockは概念実証のランサムウェアであり、Ollamaなどのフレームワーク経由でローカルLLMを連携させることで、オンデマンドでポリモーフィックなマルウェアコードを生成し、ペイロード生成を自動化できることを示しています。

PromptLockは、実行のたびに自然言語のプロンプトを使って、攻撃の計画やコード作成を組み込みのLLMモデルに委ねます。これにより、感染ごとに固有の亜種が生成され、検知や攻撃者の特定を困難にしています。

このペイロードはローカルのAPIエンドポイントを利用してオープンウェイトLLMを呼び出し、ステルス性と柔軟性を求める攻撃者にとって、シャドーAIインスタンスがいかに価値の高い資産となり得るかを実証しています。

ComfyUIプラグインを悪用したドライブバイ攻撃

有名企業の従業員が、ローカル環境でのAI画像生成を試そうと、ComfyUIのプラグインまたは拡張機能(ComfyUI_LLMVISION)とされる未検証のAIアート生成ツールをGitHubからダウンロードしました。

ダウンロードされたソフトウェアは一見正当なものに見えましたが、マルウェアと情報窃取型マルウェアが埋め込まれていました。このマルウェアは従業員のコンピューターを侵害し、認証情報を窃取することで、攻撃者が社内の通信やシステム、機密ファイルにアクセスできるようにしました。

ChatGPTを介した大手企業の内部情報漏えい

大手企業2社において、独自のコードや機密性の高い内部情報がChatGPTに入力され、その結果、自社固有のデータがモデルの応答に表示される事案が発生しました。

悪意のあるDeepSeekインストーラー

複数の攻撃キャンペーンにおいて、DeepSeekのインストーラーを装い、開発ツールになりすます悪質なコードが確認されています。

Sainbox RATや隠しルートキットを配布するための偽のインストーラーが確認されています。これらはDeepSeekのインストーラーを装い、フィッシングメールを通じてMSIファイルの形式で配布されています。
DeepSeekの人気を悪用し、攻撃者は不正なドメインや偽のCAPTCHAページを作成しています。これらを介して、被害者のシステム上でコードを注入および実行します。
攻撃者はAIモデルDeepSeekの偽インストーラーを作成し、内部にマルウェアを埋め込みました。

DeepSeekは非常に人気のあるAIモデルであり、OpenRouterやAlibaba Cloudなど、米国以外のさまざまなモデルリポジトリで入手できます。ユーザーは通常、こうしたプラットフォームからモデルをダウンロードしており、米国国外のユーザーを対象としたローカルLLMフレームワークも同様の場所で提供されています。この傾向は、IoTデバイスやロボットなどのAIが組み込まれた機器においても同様です。DeepSeekにこれほど多くのバージョンが存在する理由は、このモデルが「蒸留(ディスティレーション)」によって開発されているためです。この手法は、大規模なモデルを使ってより小さなモデルにその振る舞いや推論を模倣させる技術です。そのため、モデルリポジトリでは、下の図のように名前に「DeepSeek」が付いたモデルが多数見られます。

DeepSeek

監視が重要である理由

ローカルLLMを実行するフレームワークの監視は、組織のセキュリティとコンプライアンスに重大なリスクをもたらすデータ漏えいを防ぐために不可欠です。監視の行き届かないLLMでは、プロンプト入力、ファインチューニングのプロセス、あるいは生成された出力などを通じて、機密情報や規制対象データが意図せず流出してしまう恐れがあります。こうした情報漏えいは、深刻なプライバシー侵害や、GDPR、HIPAA、PCI DSSといった重要なコンプライアンスフレームワークへの違反につながり、組織に重大な法的および財務的影響をもたらす可能性があります。

適切な監視が欠如していると、組織の意思決定や責任の所在において、危険な盲点が生じます。シャドーデプロイメント(未承認または未追跡のLLM実装)を通じたAI主導のビジネスの意思決定には、監査証跡が一切残らないため、その意思決定に伴うリスクを追跡、説明、管理することが不可能になります。さらに、監視なしで運用されるローカルフレームワークは、集中型のアクセス制御や包括的なログ記録システム、定期的な脆弱性のパッチ適用といった重要なセキュリティ対策が不十分な場合が多く、こうした弱点を悪用しようとする攻撃者にとって、格好の標的となります。

検出ルール

ローカルLLMフレームワークを介したシャドーAIの可能性を検知し、防御するために活用できる検出ルールをいくつか挙げます。

アクティブディスカバリー：組織は、ローカルで稼働するLLMインスタンスや公開されたエンドポイント、未承認のモデル利用を定期的にスキャンする必要があります。たとえば、Shodanのようなツールを活用して、インターネットに露出しているOllamaインスタンスを特定します。
SysmonやActive Directory (AD)経由で現在のWindowsログを活用し、これらのフレームワークを検知します。具体的には、特定のプロセス(例：ollama.exe、llama-run.exe、jan.exe、lms.exe)の挙動を能動的に監視することが重要です。
ネットワークポートを監視します。
- LM Studio (1234、43411)
- Ollama (11434)
- LocalAI、Llama.cpp (8080、8000)
- Jan.ai (1337)
- Text Generation Web UI (7860,5000)
- GPT4All (4891)
ファイルシステムのアーティファクト(~/.ollama、~/jan/、~/.cache/lm-studio)
モデルファイル(gguf、ggml、bin)。通常、非常にサイズが大きい
インストールディレクトリ(/Applications、/opt、C:\Users\user\AppData\Local\Programs)
APIエンドポイント
- ローカルホスト(127.0.0.1)
- OpenAI互換APIパス：/v1/chats/completions、/v1/completions、/api/tags、/api/generate
リソース使用パターン
- CPU使用率が高い(CUDA)
- RAMの使用量が非常に高い(8GB～32GB)
- 推論中にCPU使用率が急上昇する
- モデル読み込みに伴うディスクI/O
DNSネットワークトラフィック(huggingface.co、ollama.ai)
ブラウザ拡張機能

SplunkによるシャドーAIの検知

シャドーAIの発見、監視、防御に取り組むべき理由は数多くあります。具体的な取り組みとして、Sysmonポリシーセットに追加できるSysmonポリシーガイダンスファイルを利用できます。また、イベントID 4688の監査を有効にしている場合、これらのフレームワークの発見と検知を目的とした以下の検出ルールも導入できます。さらに、前述のローカルLLMフレームワークの包括的なリストも忘れずにご確認ください。これは、環境に応じてSysmonポリシーや提供された検出ルールを調整するのに役立ちます。

以下に、シャドーAIを対象とした、STRTによるローカルLLMフレームワーク検知のサンプルをいくつかご紹介します。

包括的なフレームワーク検知クエリー(全AI/LLMツール対象)

プロセス作成イベント(イベントID 4688)を監視し、WindowsエンドポイントにおけるローカルLLMフレームワークとAIツールの実行を検知します。また、普及しているオープンソースやローカルホスト型のAIプラットフォームを追跡し、企業環境におけるシャドーITの利用やデータ流出のリスク、あるいは未承認のAIツール導入を特定します。

Splunk SPL

包括的なフレームワーク検知クエリー

index="llm4688" sourcetype=XmlWinEventLog EventID=4688

| spath

| rename "Event.System.Computer" as Computer, "Event.System.EventID" as EventID

| eval NewProcessName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "NewProcessName"))

| eval ParentProcessName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "ParentProcessName"))

| eval CommandLine=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "CommandLine"))

| eval SubjectUserName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "SubjectUserName"))

| search (

    NewProcessName="*ollama*" OR

    NewProcessName="*llama*" OR

    NewProcessName="*llama-run*" OR

    NewProcessName="*gpt4all*" OR

    NewProcessName="*lmstudio*" OR

    NewProcessName="*nutstudio*" OR

    NewProcessName="*koboldcpp*" OR

    NewProcessName="*jan*" OR

    NewProcessName="*jan.exe*" OR

    CommandLine="*transformers*" OR

    CommandLine="*langchain*" OR

    CommandLine="*huggingface*" OR

    CommandLine="*llama-run*" OR

    CommandLine="*nutstudio*" OR

    ParentProcessName="*ollama*" OR

    ParentProcessName="*lmstudio*" OR

    ParentProcessName="*nutstudio*" OR

    ParentProcessName="*gpt4all*" OR

    ParentProcessName="*jan*" OR

    ParentProcessName="*llama-run*"

)

| eval Framework=case(

    like(NewProcessName, "%ollama%") OR like(ParentProcessName, "%ollama%"), "Ollama",

    like(NewProcessName, "%lmstudio%") OR like(NewProcessName, "%LM Studio%") OR like(ParentProcessName, "%lmstudio%"), "LM Studio",

    like(NewProcessName, "%nutstudio%") OR like(ParentProcessName, "%nutstudio%") OR like(CommandLine, "%nutstudio%"), "NutStudio",

    like(NewProcessName, "%gpt4all%") OR like(ParentProcessName, "%gpt4all%"), "GPT4All",

    like(NewProcessName, "%jan%") OR like(ParentProcessName, "%jan%") OR like(NewProcessName, "%jan.exe%"), "Jan",

    like(NewProcessName, "%koboldcpp%") OR like(CommandLine, "%koboldcpp%"), "KoboldCPP",

    like(NewProcessName, "%llama-run%") OR like(ParentProcessName, "%llama-run%") OR like(CommandLine, "%llama-run%"), "Llama-Run",

    like(CommandLine, "%transformers%") OR like(CommandLine, "%huggingface%"), "HuggingFace/Transformers",

    like(CommandLine, "%langchain%"), "LangChain",

    like(NewProcessName, "%llama%") OR like(NewProcessName, "%llama.cpp%") OR like(ParentProcessName, "%llama%"), "Llama.cpp",

    1=1, "Related Activity"

)

| stats count by Computer, Framework, EventID, ParentProcessName

| sort Computer, Framework, -count

包括的なフレームワーク検知クエリー

ログオンセッション単位でのローカルLLMフレームワークの追跡

このSplunkサーチでは、Windowsのプロセス作成イベント(イベントID 4688)を追跡し、ログオンIDを使って特定のユーザーセッションと紐付けることで、ローカルLLMフレームワーク(Ollama、LM Studio、GPT4All、Janなど)の利用を特定します。親プロセス名、ユーザーアカウント、コンピューター名などの主要なプロセス情報を抽出し、企業全体でどのユーザーがAIツールを実行しているかを可視化します。また、検索結果をユーザーセッションごとに集計してLLMフレームワークの実行頻度を示し、シャドーAIの導入状況の把握やAIツールの利用パターンの監視を支援します。

Splunk SPL

ログオンセッション単位でのローカルLLMフレームワークの追跡

index="llm4688" sourcetype=XmlWinEventLog EventID=4688

| spath

| rename "Event.System.Computer" as Computer

| eval SubjectUserName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "SubjectUserName"))

| eval SubjectLogonId=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "SubjectLogonId"))

| eval NewProcessName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "NewProcessName"))

| eval ParentProcessName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "ParentProcessName"))

| eval TokenElevationType=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "TokenElevationType"))

| search (

    ParentProcessName="*ollama*" OR ParentProcessName="*lmstudio*" OR

    ParentProcessName="*nutstudio*" OR ParentProcessName="*gpt4all*" OR

    ParentProcessName="*jan*" OR ParentProcessName="*llama-run*"

)

| stats count by SubjectUserName, ParentProcessName, SubjectLogonId, Computer

| sort -count

ログオンセッション単位でのローカルLLMフレームワークの追跡

存在するすべてのローカルLLMフレームワークの検知(Sysmon)

Splunk SPL

存在するすべてのローカルLLMフレームワークの検知

index="llsysmon" | spath

| eval EventID='Event.System.EventID'

| eval Image=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "^Image$"))

| eval TargetFilename=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "^TargetFilename$"))

| eval QueryName=mvindex('Event.EventData.Data', mvfind('Event.EventData.Data{@Name}', "^QueryName$"))

| search ( Image="*ollama*" OR Image="*gpt4all*" OR Image="*lmstudio*" OR Image="*kobold*" OR Image="*jan*" OR Image="*llama-run*" OR Image="*llama.cpp*" OR Image="*oobabooga*" OR Image="*text-generation-webui*" OR TargetFilename="*.gguf*" OR TargetFilename="*ollama*" OR TargetFilename="*jan*" OR QueryName="*huggingface.co*" OR QueryName="*ollama.com*" )

| eval Framework=case(

    match(Image, "(?i)ollama") OR match(TargetFilename, "(?i)ollama") OR match(QueryName, "(?i)ollama"), "Ollama",

    match(Image, "(?i)lmstudio") OR match(Image, "(?i)lm-studio") OR match(TargetFilename, "(?i)lmstudio"), "LMStudio",

    match(Image, "(?i)gpt4all") OR match(TargetFilename, "(?i)gpt4all"), "GPT4All",

    match(Image, "(?i)kobold"), "KoboldCPP",

    match(Image, "(?i)jan") OR match(TargetFilename, "(?i)jan"), "Jan AI",

    match(Image, "(?i)llama-run") OR match(Image, "(?i)llama-b") OR match(Image, "(?i)llama.cpp"), "llama.cpp",

    match(Image, "(?i)oobabooga") OR match(Image, "(?i)text-generation-webui"), "Oobabooga",

    1=1, "Other"

)

| search Framework!="Other"

| stats count by Framework, Event.System.Computer, host

| sort -count

存在するすべてのローカルLLMフレームワークの検知

まとめ

シャドーAIは、企業にとって明確かつ差し迫った脅威となっています。これは、最新技術を学び活用しようとするユーザーの動きに加え、機密情報のパブリッククラウドへの流出を防ぎつつ、LLMフレームワークの運用コストを抑えようとする企業の取り組みが背景にあります。このブログで説明してきたように、これらの技術に伴うリスクを未然に防ぎ、対処するためには、企業内におけるこれらのフレームワークの利用を発見、監視、分析することが不可欠です。

STRTは、これらのアプリケーションや主要なフレームワークを検知するためのガイダンスとコンテンツを提供し、お客様がシャドーAIの脅威に対処できるよう支援します。

このブログはこちらの英語ブログの翻訳、山村悟史によるレビューです。

Rod Soto

Worked at Prolexic, Akamai, Caspida. Won BlackHat CTF in 2012. Co-founded Hackmiami, Pacific Hackers meetup and conferences.

AI 14 分程度

エキスパートシステムからエージェンティックAIへ：サイバーセキュリティにおけるAIの進化

AIに起きた過去数十年間のイノベーションを振り返りながら、AIがサイバーセキュリティの状況をどのように変えてきたか、そして常に脅威に先手を打つには何が必要かを探ります。

AI 5 分程度

CIO向けSplunk AI Toolkitガイド：後追い対応のITから予測型ITへ

SplunkのAI Toolkitは、チームがインシデントを予測し、ダウンタイムを削減し、デジタルレジリエンスをエンタープライズ規模で実現できるよう支援します。

AI 8 分程度

ポストMythos時代の防御対策：最先端AIがSOC (セキュリティオペレーションセンター)にもたらす変化

SOCの未来の鍵を握るのは、迅速な検証、信頼できるコンテキスト、人間による判断です。

Splunkについて

世界をリードする多くの企業が、デジタルレジリエンスを継続的に強化するために、シスコの一員であるSplunkを利用しています。業界屈指のAIを活用したセキュリティとオブザーバビリティの統合プラットフォームです。

Splunkの実績あるセキュリティ製品とオブザーバビリティ製品は、あらゆる規模の複雑なデジタル環境のセキュリティと信頼性を向上させるソリューションとして、お客様から高い評価を得ています。

Splunkの詳細はこちら

発見から防御へ：ローカルLLMを検知してシャドーAIに対処

ローカルAIフレームワーク

GGUF (Georgi Gerganov Universal Format)

GPTQ (Generative Pre-trained Transformer Quantization)

AWQ (Activation aware Weight Quantization)

Ollama

LM Studio

GPT4All

Llama.cpp：アプリケーションではなく、その中核を担うエンジン

その他の注目すべきフレームワーク

ローカルLLMとシャドーAIの関係

牙を剥き始めたシャドーAI

監視が重要である理由

検出ルール

SplunkによるシャドーAIの検知

包括的なフレームワーク検知クエリー(全AI/LLMツール対象)

ログオンセッション単位でのローカルLLMフレームワークの追跡

存在するすべてのローカルLLMフレームワークの検知(Sysmon)

まとめ

関連記事

エキスパートシステムからエージェンティックAIへ：サイバーセキュリティにおけるAIの進化

CIO向けSplunk AI Toolkitガイド：後追い対応のITから予測型ITへ

ポストMythos時代の防御対策：最先端AIがSOC (セキュリティオペレーションセンター)にもたらす変化

Splunkについて

XでSplunkとつながる

FacebookでSplunkとつながる