AIシステムがネコとイヌをなぜ正確に区別できるのか、あるいは不適切なコンテンツがオンラインでどのようにフィルタリングされているのか、不思議に思ったことはないでしょうか。多くの場合、その背後には「人間参加型」(HITL:Human-in-the-Loop)という仕組みが存在します。
簡単に言えば、自動化されたプロセスやAIドリブンなプロセスに人間が介在し、重要な役割を担えるようにする仕組みのことです。人間の関与は、次のような目的で行われます。
機械の知能が人間の能力を凌駕するのも時間の問題かもしれない。汎用人工知能(AGI:Artificial General Intelligence)については、そのような可能性がさかんに議論されていますが、現時点で最先端のAI製品、とりわけ消費者向けの製品は、もっぱらHITLの仕組みに基づいて開発されています。情報の品質を管理するデータエンジニアから、新しいアルゴリズムを設計する機械学習(ML)研究者に至るまで、人間によるフィードバックは、機械の知能を向上させ、高い品質と信頼性を実現するために欠かせない要素なのです。
AIにおいてHITLが必要とされる理由は、データやモデルの挙動にまつわるいくつかの根本的な課題にあります。
つまり、データエンジニアリング、モデルトレーニング、AIアプリケーションのデプロイといったプロセスのすべてを、人間の判断と介在を通じて慎重に管理する必要があるわけです。これにより、データの処理方法、モデルの学習方法、およびAIアプリケーションの最終的な動作を制御できるようになります。
人間がAIシステムに介在するにあたっては、いくつかの一般的なアプローチがあります。
アクティブラーニングでは、人間は主に、データのラベル付けと注釈付けを中心としたデータ処理タスクに関与します。学習プロセスの大部分は機械が実行しますが、最も有用な情報や、人間が介在して明確化する必要がある曖昧なデータを機械が戦略的に選び出します。
機械はモデルをトレーニングするだけでなく、そのモデルの学習にとって重要な(または重要でない)特徴量の見極めについて人間の判断を仰ぐことができます。膨大なデータセット全体に手作業で注釈を付けるのは時間とコストがかかるうえに、これをリアルタイムで行うのは事実上不可能です。アクティブラーニングでは、学習アルゴリズムがモデルの改善に最も欠かせないデータポイントや特徴量を特定することで、この作業を効率化します。これにより、トレーニングデータの品質と多様性が向上し、モデルの汎用化が適切に行われるようになります。
人間の介在を伴うアクティブラーニングは半教師あり学習の一種で、ラベルはすべてのデータに最初から付けられるのではなく、学習の過程で必要に応じて付与されます。これは、教師あり学習(すべてのデータにラベルが付与される)や教師なし学習(どのデータにもラベルが付与されない)とは対照的なアプローチです。
医療画像解析に用いられるAIが、スキャン画像の中で確信を持って分類できない曖昧な箇所にフラグを立てたとします。その後、放射線科医(学習に介在する人間の専門家)がこの特定の箇所を確認し、正しいラベル(「良性」や「悪性」など)を付与すると、このフィードバックがAIの学習に反映され、以降の同じようなスキャン画像での分類精度を高めることができます。
インタラクティブ機械学習(IML)では、人間がAIモデルのトレーニング、改善、指導に直接かつ繰り返し関与することで、分類精度の向上を図ります。初期のIMLは、決定木のような従来型AI手法の分類精度を改善することに重点が置かれていました。しかしその後は、AIモデルの分類境界の決定を支援することに焦点が移っています。
たとえば、複数のAI分類器によって生成された混同行列(正しい分類と誤った分類を表示してモデルの予測精度を可視化した表)を人間の作業者が分析し、それらの分類器を効果的に組み合わせる戦略を立てるといったようなシナリオが考えられます。この場合、複数のモデルが連動する分類器の「アンサンブル」モデルが、人間の知見に基づいて再トレーニングおよび最適化されることになります。
現代のIMLでは、人間と機械がさまざまな役割を担えるようになっています。人間は、トレーニング中にモデルの予測を検証したり、モデルの学習を支援したり、データのラベル付けに専念したりすることが可能です。つまり、IMLは、人間の介在によって有用な成果物を生成し、モデルのトレーニングとパフォーマンスを改善するプロセスなのです。これを実現するには、人間と機械がやり取りできるインターフェイスと反復的な学習手法が必要になります。
あるストリーミングサービスのコンテンツ推奨システムが、IMLを利用しているとします。この場合、ユーザーが映画のおすすめに対して「高評価」や「低評価」を付けたり、無視したりするといった行動が、直接的なフィードバックとなります。AIはこのフィードバックを利用することで、ユーザーとやり取りしながらユーザーの好みに対する理解度を高め、さらに適切なおすすめを提示できるようになります。
マシンティーチングは、人間の「教師」がAIモデルの学習プロセスを制御、支援するAIの手法です。教師はたいてい特定分野の専門家で、機械学習に関する高度な知識がないことも少なくありません。この手法の核心にあるのは転移学習というアプローチです。これによって人間の専門家が自分の知識を機械に伝えます。ラベル付きデータが不足している場合や入手できない場合は特に、このアプローチが有効となります。
実際には、このプロセスは次のように進められます。
この分野の重要なカテゴリの1つに、人間のフィードバックによる強化学習(RLHF:Reinforcement Learning from Human Feedback)があります。RLHFは、人間がモデルに影響を与える方法が、従来のマシンティーチングと異なっています。RLHFでは一般に、人間がモデルの挙動に対してフィードバックを与えたり、報酬システムを構築したりすることでモデルの振る舞いを教化し、この作業を繰り返すことで学習プロセスを調整していきます。この手法がよく用いられるのは、エージェンティックAIのユースケースと大規模言語モデル(LLM)のユースケースです。
あるサイバーセキュリティの専門家が、新たなタイプの巧妙なフィッシングメールの識別についてAIを指導するとします。専門家は、最近のフィッシングメールの例と無害なメールを厳選し、新たな脅威を特徴付ける微妙な言語的手がかり、疑わしいリンク構造、送信者のなりすましの手法をわかりやすく示します。こうした専門家によるカリキュラムを通じて、AIは特定の攻撃を、生データだけで学習した場合より効果的に検出できるようになります。
実際には、最新のHITL手法の多くは、マシンティーチングの要素(IMLはたいていその一部と見なされます)とRLHFを組み合わせたもので、特に高度なAIアプリケーションで利用されます。
HITLは大きなメリットを提供しますが、課題ももたらします。
メリット:
課題:
HITLは一時的な対策ではなく、堅牢で信頼性が高く、責任あるAIシステムを構築する上で欠かせない要素です。AIテクノロジーが進歩を続ける中でも、以下のような取り組みにおいては、依然として人間による洞察、判断、監督が重要になります。
人間の知性と機械の能力を連携させることが、安全かつ効果的な形でAIの潜在能力を最大限に引き出すための鍵なのです。
このブログはこちらの英語ブログの翻訳、大久保 かがりによるレビューです。
この記事について誤りがある場合やご提案がございましたら、splunkblogs@cisco.comまでメールでお知らせください。
この記事は必ずしもSplunkの姿勢、戦略、見解を代弁するものではなく、いただいたご連絡に必ず返信をさせていただくものではございません。
Splunkプラットフォームは、データを行動へとつなげる際に立ちはだかる障壁を取り除いて、オブザーバビリティチーム、IT運用チーム、セキュリティチームの能力を引き出し、組織のセキュリティ、レジリエンス(回復力)、イノベーションを強化します。
Splunkは、2003年に設立され、世界の21の地域で事業を展開し、7,500人以上の従業員が働くグローバル企業です。取得した特許数は1,020を超え、あらゆる環境間でデータを共有できるオープンで拡張性の高いプラットフォームを提供しています。Splunkプラットフォームを使用すれば、組織内のすべてのサービス間通信やビジネスプロセスをエンドツーエンドで可視化し、コンテキストに基づいて状況を把握できます。Splunkなら、強力なデータ基盤の構築が可能です。