来歴情報で責任あるオープンソースAIガバナンスを実現

CIO Office June 17, 2026 Alie Fordyce , Lauren Stemler

オープンソースとオープンウェイトのAIモデルの急速な成長により、AIの開発およびデプロイの方法が根本的に変化しています。この成長により、柔軟性の向上、イノベーションの加速、および特殊な環境や機密性の高い環境に合わせたモデルの構築が可能になりました。

その一方で、新たな課題も生じています。多くのAIシステムが複雑かつ階層化されたサプライチェーン上で構築されるようになり、理解や統制がますます困難になっているのです。

モデルがさまざまなチームや組織によってファインチューニングされ、組み合わせて使用されるようになる中、モデルの出所、トレーニングデータ、ライセンスに関する問題は、理論上の懸念から運用上のリスクへと変化しています。コンプライアンスチームにとって、モデルがどのように構築されたか、あるいはどのような義務を伴うのかを明確にできなければ、コンプライアンスやレジリエンス、ユーザーの信頼を損なうおそれがあります。

この記事では、オープンソースAIモデルの時代において、AIモデルの来歴情報の追跡がもはや避けられなくなった理由を探ります。エコシステムの拡大が続く中、来歴情報は組織による大規模なリスク管理を支援し、オープンソースAIに安全性をもたらすために欠かせない透明性と説明責任を確保することを可能にします。

セキュリティチームが管理性と透明性を求めてオープンソースAIに移行している理由

オープンソースAIのセキュリティモデルを確立することは、現代のセキュリティに求められるレジリエンス、透明性、イノベーションを実現するのに不可欠な戦略的課題です。実際のサイバーセキュリティ運用において、複雑さは例外ではなく、もはや常態となっています。現代のワークフローでは、複数の大規模言語モデル(LLM)を連携させながら、計画立案、要約、提案の生成といったタスクを実行しています。

オープンソースモデルとオープンウェイトモデルは以下のことを可能にするため、急速にその必要性を増しています。

特定のニーズに合わせてモデルをファインチューニングし、新たな脅威や業界固有の要件に迅速に対応する。
パフォーマンスの向上、レイテンシーの削減、オンプレミス環境のセキュリティ強化を目指してシステムを最適化する。これは、運用要件やコンプライアンス要件が厳しい組織にとって極めて重要です。
デプロイの完全な制御を維持する。これは、特にデータをオンプレミスに保持することが求められる隔離環境、規制の厳しい環境、または機密性の高い環境において重要です。

対照的に、クローズドなAPIベースのモデルはベンダーロックインを招き、透明性、柔軟性、監査可能性を制限するおそれがあります。オープンソースモデルは、セキュリティや主権を犠牲にすることなくカスタムソリューションを提供できるため、CTI-RCMベンチマークなど実世界のサイバーセキュリティベンチマークにおいて、クローズドモデルと同等以上の性能を示すことが増えています。

オープンソースのモデルやデータセットの公開ペースは加速しています。Hugging Faceなどの主要なリポジトリでは、現時点で200万を超えるモデルがホストされているほか、新しいモデルやデータセットが絶えず追加されています。

オープンソースのモデルやデータセットの膨大な規模は、AIモデルのサプライチェーンが複雑化する要因でもあります。チームが巨大なモデルやデータセットを再利用したり改変したりするにつれて、依存関係の追跡はますます困難になっていきます。デプロイされたのが単独のシステムであっても、複数の上流モデルやトレーニングデータセットが組み込まれていることが多く、それらの出所を限られた範囲でしか可視化できない場合も少なくありません。このようなモデルを再利用すれば、イノベーションを加速させ、導入のハードルを引き下げることができますが、トレーサビリティの仕組みが欠けていると、継承されたリスクの評価やコンプライアンス義務の遵守が複雑になるおそれもあります。

オープンソースソフトウェア時代における課題

AIモデルの規模と多様性は、イノベーションの新たな機会を提供するだけでなく、これまでにないセキュリティリスクももたらします。

エコシステムの急速な拡大に伴って浮上している新たなリスクの1つは、AIモデル開発の基盤となるサプライチェーンシステムの複雑化です。たとえば、組織やチームが再利用、改変、ファインチューニングを行うオープンソースのモデルやデータセットにおいて、上流の依存関係やコントリビューターに関する記録が一部しか入手できないことが少なくありません。デプロイされたのが単独のシステムであっても、複数の基盤アーキテクチャや派生チェックポイント、および外部から取得したデータセットが組み込まれている場合は、それぞれに異なるライセンス条件、データ利用制限、または法域要件が適用されます。明確なリネージ(モデルの来歴管理)がなければ、組織は知らないうちにコンプライアンス上の欠陥を継承し、デプロイ後に初めて問題が表面化する事態を招きかねません。

AI時代における徹底したデューデリジェンスでは、モデルの出所、改変、管理に関する履歴をライフサイクル全体で体系的に追跡する能力が求められます。そして、このようなリスクに対処するには、来歴を把握することが極めて重要になるのです。

モデルの来歴追跡機能が果たす重要な役割

このような課題の解決策として、来歴情報はAIモデルの出所、開発方法、デプロイ時の制約に関する重要な情報を提供し、AIシステムに対する信頼の基盤を築きます。

来歴情報が信頼の確保に欠かせないとする考えは、世界中の規制当局や政策立案者の間で共有されており、AIモデルのリネージの重要性に対する関心はますます高まっています。たとえば欧州では、EU AI法において、オープンソースを含む特定のAIモデルに対して、トレーニングデータ、出所、モデルアーキテクチャの開示が義務付けられています。米国では、国防総省のサプライチェーンリスク管理(SCRM)分類基準において、規制およびコンプライアンスのリスク、外国による所有、支配、影響(FOCI)に関するリスク、サイバーセキュリティリスクなど、重要なリスクカテゴリが定められています。

国際的には、ISO 42001 AIリスク管理フレームワークにおいて、AIモデルのトレーサビリティ、記録、透明性、およびガバナンスを確保するためにデータの来歴を追跡することの重要性が強調されています。来歴情報は、組織がこのようなフレームワークに自社のモデルを適合させるのに役立てることができます。そうすることで、来歴追跡は単なる機能にとどまらず、安全で安心なAI導入の推進力となるのです。

政策機運の高まりを実践へとつなげる

オープンソースがAIのセキュリティ、プライバシー、イノベーションの基盤として機能しているとの認識が、政策立案者たちの間で広がり始めています。ホワイトハウスのAI行動計画は、オープンソースおよびオープンウェイトのAIモデルの採用と開発を支援しています。オープンであることは、透明性の向上につながり、デプロイ環境に対するより強力な管理能力を実務担当者に与え、より広範なセキュリティコミュニティとともにイノベーションを推進することを可能にします。

この計画書に書かれているように、AIオープンソースモデルはその柔軟性ゆえに、イノベーションにおいて独自の価値を持っています。そのため、これらのモデルは、民間企業や政府機関にもさまざまな利点をもたらします。こうした組織の多くが、クローズドモデルのベンダーとは共有できない極秘データや機密データを保有しているからです。

また、この計画書は、オープンソースが強力なサイバーセキュリティ態勢に不可欠であり、強固なデータプライバシーとコミュニティ主導のイノベーションを可能にすることを強調しています。さらに、特に研究者や中小企業を念頭に、計算リソースへのオープンなアクセスを奨励するとともに、オープンモデルを機密データのセキュリティを強化するものと位置付けている点が注目されます。

米国では、ホワイトハウスだけでなく、国家安全保障に関わる機関も、オープンソースモデルを採用する意義を強調しています。2025年6月には、国家安全保障局(NSA)が、人工知能セキュリティセンター(AISC)と共同で、データセキュリティのベストプラクティスを推奨する共同ガイダンスを発行しました。このガイダンスには、安全なAI開発におけるオープンソースAIモデル(Hugging Faceなどのプラットフォームから利用可能)の重要性が明記されています。また、透明性、データの出所、完全性など、政策上の重要な利点が強調されています。

AIモデルの来歴情報における重要な要素

前述したように、AIモデルの来歴の証明に役立つ基準や慣行の体系はますます高度化しています。以下は、堅牢なAIサプライチェーンガバナンスの実現にとって重要な来歴情報のカテゴリです。

製造情報：AIモデルのパラメーター、トレーニング計算しきい値、および配布プラットフォームに関するメタデータを収集することで、組織はモデルの選定時やデプロイ時にデューデリジェンスを証明できます。
プロバイダー：モデルの作成または提供に関与した組織や団体(その原産国を含む)を特定することが、リスク評価に役立ちます。たとえば、輸出管理、制裁措置、または業界固有の規制への準拠を評価する際には、外国資本による所有や支配の有無を把握することが極めて重要になります。
リネージ：基盤モデルの構築やその後の改変など、モデルの開発履歴を追跡する活動が含まれます。
ライセンス：ライセンス条項と使用権、および潜在的な制限(リモートアクセスやサイズに関する条項など)を明らかにすることで、組織はライセンス上の制限をより正確に特定、把握できるようになります。
セキュリティ評価：来歴情報は、既知の脆弱性の開示やその軽減策などを通じて、組織がセキュリティ関連の要件やポリシーを満たすのに役立ちます。

オープンソースAIが幅広い業界で普及するにつれて、組織はガバナンスに関して徹底したデューデリジェンスを実施する責任と説明をますます求められるようになるでしょう。来歴情報を活用してその基盤を整えておくことは、コンプライアンス違反、罰金、予期せぬ監査といった将来の問題を防ぐ上で大いに役立つはずです。

AIの来歴情報の追跡を標準運用プラクティスに

組織がAIガバナンスと透明性の基準を引き上げる中、来歴情報は抽象的な概念から実務上の要件へと変化しつつあります。モデルがどのように構築、改変、デプロイされたのかを一貫性のある形で記録できるようにするための基準や実務も、小規模ながら拡大しています。モデルカードや、データセット向けのデータシートといった仕組みは、モデルの挙動、トレーニングデータの特性、および用途に関する情報を体系的に記録するための手段を提供します。

プラットフォームレベルでは、Hugging Faceなどのリポジトリが、リネージ、ライセンス、利用制限に関するメタデータの公開を開始しています。このような情報がまだ一律に適用されているわけではありませんが、オープンソース環境における来歴情報の大規模な可視化に向けた重要な一歩と言えるでしょう。

実務面において、来歴情報を効果的に活用するには、完全性より一貫性を重視しましょう。組織に求められるのは、過去にさかのぼって完全なリネージを再構築しようとすることではなく、モデルの取り込み、ファインチューニング、デプロイの承認といった重要な意思決定に来歴情報の要件を組み込むことです。たとえ部分的であれ、モデルの出所、依存関係、ライセンス条件が可視化されれば、監査可能性を大幅に向上させ、システムの進化に伴う不確実性を低減することができます。

継続的なモニタリング、ドリフト検知アラート、ロールバック計画、そして定期的なモデルの再承認。これらを確実に実施することが、AIの信頼性と安全性を維持するための鍵となります。

安全なオープンソースソフトウェア(OSS) AI導入の基盤としての来歴情報

相互につながり合ったデジタル世界において、透明性を信頼へと昇華させることは、一足飛びに成し遂げられるものではありません。これは継続的なプロセスであり、開発者、組織、政策立案者の誰もが取り組む必要があります。

オープンソースは、単なる技術的な選択肢ではなく、レジリエンスに優れ、信頼性の高いデジタルインフラを実現するための戦略的な推進力となり得るものです。ホワイトハウスや国家安全保障に関わる機関からの支援を背景に、オープンソースのセキュリティモデルは、安全かつ責任あるAIの未来を形作る一助となるでしょう。そして、堅牢で標準化された来歴情報があれば、組織は豊富なOSSモデルやデータを安全に活用し、その潜在能力を最大限に引き出すことができるようになります。

このブログはこちらの英語ブログの翻訳、前園曙宏によるレビューです。

Style

two-column