データインサイダー

AI(人工知能)と機械学習とは?

AI(人工知能) とは、観察、思考、反応といった人間のふるまいを機械に行わせる技術を指します。その研究の基礎には、人間の知能はコンピューターでプログラム的に模倣可能な個々の明確な能力に分割できる、という考えがあります。AI は、機械学習 (ML) を含む幅広い概念と技術を包括する用語です。

AI には数多くの下位分野があり、その各分野で、人間の自然知能と結び付いた特定のふるまいを模倣する技術が使用されます。たとえば、人間は言葉を話し、聞き、読み、書いて言葉の意味を学ぶことができます。音声認識や自然言語処理の分野では、音声信号をテキストに変換し、そのテキストを処理して意味を導き出すことによって、これらの能力を模倣します。ほかにも、物理的な環境に適応して動くロボティクス、視覚情報を認識して処理するコンピュータービジョン、物体を識別して分類するパターン認識など、人間の能力を再現するさまざまな人工システムが下位分野で研究されています。

AI のアルゴリズムは今日、社会のさまざまな場面で利用され、無数の研究プロジェクトによって日々新しい用途が開拓されています。

機械学習とは?

機械学習とは、自律的に経験 (入力データの処理) から学習し、特定の課題の遂行能力を高めるコンピューターシステムを研究、開発する、コンピューターサイエンスの 1 分野を指します。「機械学習」と「人工知能」は混同されがちですが、機械学習は AI の下位分野の 1 つです。

 

AI と機械学習:基本

弱い AI とは?

弱い AI は、「狭義の AI」とも呼ばれ、入力に対し、プログラミングアルゴリズムに基づいて人間のような反応をする AI です。弱い AI を組み込んだツールは、「思考」しているように見えても、実際にはしていません。Siri、CortanaAlexa のような、音声で動くパーソナルアシスタントがその良い例です。これらのツールは、ユーザーが質問や命令をすると、その音声に含まれるキューを聞き取り、プログラムされた手順に従って適切な応答をします。ユーザーが話す言葉やその意味を本当に理解しているわけではありません。

 

強い AI とは?

強い AI は、「真の AI」とも呼ばれ、自律的に思考する AI です。強い AI を組み込んだシステムは、推論、学習、計画、意思疎通、判断、そしてある程度の自己認識ができます。本質的に、人間の知能の模倣ではなく、少なくとも理論上は知能そのものです。専門家は、人間の脳の構造と機能を再現できれば、真の認識能力を持つコンピューターを作れるはずだと考えています。AI の下位分野であるディープラーニングの研究者は、ニューラルネットワークを使ってコンピューターに学習させることで自律性を高めようと試みていますが、SF (サイエンスフィクション) 作品に描かれるような自己を持った AI にはまだ遠く及びません。急速に進歩していることは確かですが、現時点では、真の強い AI はまだ理論の段階で、実現はずっと先と考えられます。

機械学習と人工知能の違い

機械学習は AI の下位分野の 1 つです。AI の応用分野であり、経験から学習して特定の課題の遂行能力を高めるコンピューターを研究、開発します。コンピューターがデータを分析し、さまざまな統計的手法を用いてそのデータから学習することで、問題解決能力を自律的に向上させることを目指しています。

機械学習のアルゴリズムはよく、「教師あり」と「教師なし」に分類されます。

same-ai-ml

教師あり機械学習とは?

教師あり機械学習では、学習プロセスの間、データサイエンティストが AI アルゴリズムを指導します。サイエンティストは、例題とその例題に期待される特定の結果 (ラベル) を含むトレーニングデータをアルゴリズムに与えます。その後、どの変数を分析すべきかを決め、コンピューターの予測精度についてフィードバックを与えます。「教師」によるトレーニングを十分に重ねると、コンピューターは、トレーニングデータに基づいて、新しい入力データの結果を予測できるようになります。

 

教師なし機械学習とは?

教師なし機械学習では、アルゴリズムにトレーニングデータを与えますが、その中に正誤を判定する既知の結果は含まれません。正解を見つけさせるのではなく、データを分析して未知のパターンを見つけさせます。教師なし学習のアルゴリズムでは、同類のデータをまとめたり、データセット内で異常値を検出したり、異なるデータポイントを相関付けてパターンを特定したりできます。

半教師あり機械学習 もあります。このアルゴリズムでは、その名が示すとおり、ラベル付きとラベルなしの両方のトレーニングデータを組み合わせます。ラベル付きのトレーニングデータを少数加えることで、予測精度を大幅に向上させると同時に、大量のデータのラベル付けにかかる時間とコストを節約できます。 

AI と機械学習

ディープラーニングとは?

ディープラーニングは、「深層学習」とも呼ばれ、人間の脳をできるだけ忠実に模倣しようとする、機械学習の下位分野の 1 つです。一般的には、ディープ ニューラル ネットワークと呼ばれる、脳構造に基づくモデルを使って、人間のニューロンシステムをエミュレートします。ディープラーニングの詳細は複雑ですが、基本的に、ディープラーニングのモデルでは、データを反復的に分析することで、より人間に近い思考方法で結果を導き出します。機械学習のアルゴリズムでは、予測が間違っていた場合、人間がそれを指摘して、必要な修正ができるようにします。こうして人間が介在することで、アルゴリズムの予測精度を高めます。一方、ディープ ニューラル ネットワーク (ディープラーニングのアルゴリズム) では、ニューラルネットワークが予測精度を自ら認識します。そのため、ディープラーニングは、通常の機械学習モデルが対象とするよりも複雑な課題に適しています。

 

データマイニングも機械学習の一種か?

データマイニングは機械学習とは異なります。データマイニングは、大量のデータから、パターン、関係、異常値、その他の知見を抽出するプロセスです。これに対して機械学習では、データセットを学習して特定の課題の遂行能力を高めていきます。そのため、データマイニングで抽出したデータを課題遂行の材料として機械学習に与えることはできますが、この 2 つは実質的に異なるツールです。

 

エキスパートシステムとは?

エキスパートシステムは、人間並みの意思決定能力を模倣する、初期形態の AI であり、その開発は 1970 年代にさかのぼります。このシステムでは、問題を既存の知識ベースで検索し、一連の if-then ルールによる判断を通して専門家 (エキスパート) と同等の結論を導き出します。ただし、外部データから学習して精度を継続的に高めることができないため、真の AI とはみなされないこともあります。

 

AI プログラミングとは?

AI プログラミングは、開発者がアプリケーションに AI 機能を組み込むためのソフトウェアプログラミングの一種です。よりスマートな検索エンジンの開発といった基本的な用途から、車の自動運転といった複雑な用途まで幅広く使われます。

 

人工知能に最適なプログラミング言語

AI の開発でよく使用されるプログラミング言語は、Python、Java、C++、LISPProlog です。

  • Python:Python は、その適応範囲の広さと構文の簡潔さから、AI 開発者の間で人気の高いプログラミング言語です。オブジェクト指向、関数型、手続き型のいずれのプログラミングスタイルにも対応します。また、移植性が非常に高く、Linux、Windows、MacOSUNIX のいずれでも、コードを少し変えるだけで実行できます。さらに、AI 開発者向けの便利なライブラリが豊富に提供されています。代表的なライブラリには、自然言語処理用の NLTK と SpaCy、科学計算用の Numpy、機械学習用のscikit-learn、ディープ ラーニング アプリケーション用の TensorFlow、PyTorch、Apache MXNet などがあります。
  • Java:Java は、一般的なソフトウェア開発で人気のある言語の 1 つであり、AI 開発にもよく使用されます。移植性が高く、アルゴリズムのコードを簡単に書くことができ (AI プログラミングには重要な点です)、デバッグも容易です。標準ライブラリとして、自然言語処理用の CoreNLP、複雑な計算用の ND4J、ディープラーニング用の DL4J などが提供されています
  • C++:C++ は、処理速度が極めて速く、最速のプログラミング言語として広く知られています。高速性は、計算量の多い AI アプリケーションにおいて非常に重要です。ほかの言語と比べて習得が難しいため、開発者が最初に選ぶ言語ではありませんが、機械学習やニューラルネットワークの構築を含むアプリケーションの開発ではよく推奨されます。
  • LISP:ジョン マッカーシー氏が 1958 年に開発した LISP は、Fortran の次に長い歴史を持つ言語です。その古さにもかかわらず、優れたプロトタイピング能力や S 式の処理効率の良さから、現在でも人気があります。LISP が持つ機能の多くは、ほかの新しい言語でも利用可能なため、独自性はほとんど失われていますが、それでも機械学習開発でよく使用されています。
  • Prolog:Prolog も歴史の長いプログラミング言語ですが、LISP ほどの汎用性はありません。ルールベースの宣言型言語で、さまざまな質問に答えるプログラムを簡単に作成できるため、比較的単純な問題/解法型の AI 用途に最適です。また、バックトラックがサポートされるため、アルゴリズムを簡単に管理できる利点もあります。

人工知能の発明者

1955 年に「人工知能」という言葉を考案し、世界初の AI 開発向けプログラミング言語である LISP を開発したコンピューターサイエンティスト、ジョン マッカーシー氏が、AI の生みの親として一般的に認められています。ただし、AI のアイデアはそれ以前からありました。

AI の概念は、20 世紀初頭にはすでに SF (サイエンスフィクション) の世界に登場しています。あくまで概念であった AI を現実のものとするための条件が整ったのは、1949 年、世界初のプログラム内蔵式コンピューターが実用化されたことによります。それから数年で多くの科学者や研究者が、コンピューターを論理的な規則に基づく処理を超えて「思考する機械」にするための理論を探究し始めました。

その中で卓越した成果を生み出した 1 人が英国の数学者、アラン チューリング氏です。彼は 1950 年に『計算する機械と知性 (Computing Machinery and Intelligence)』という論文を発表し、その中で機械の知性をテストする方法を提案しました (これは後に「チューリングテスト」と呼ばれます)。その 5 年後、ハーバート サイモン氏、アレン ニューウェル氏、クリフ ショー氏の 3 人が、人間の問題解決能力を模倣した世界初のプログラム、Logic Theorist を開発しました。

ジョン マッカーシー氏が、ダートマス大学で開催された研究会議の議題提案書の中で「人工知能」という言葉を使うまで、AI は研究分野として明確には確立されていませんでした。マッカーシー氏が提案書に書いた次の言葉がすべてを変えたのです。「この研究は、学習のあらゆる側面、そして知能のその他いかなる特徴も、原則として、機械でシミュレートできるように明確に説明可能である、という推測に基づいて進められます。機械に言語を使わせ、抽象概念や観念を形成させ、人類に残されたさまざまな課題を解決させて、機械自身を向上させる方法を見出す試みがこれから行われようとしているのです」

AI(人工知能)とML(機械学習)の活用ビジネス

AI や機械学習をビジネスでどのように活用するのか?

機械学習はすでに、日常生活のさまざまな場面で活躍しています。たとえば Facebook は、ニュースフィードのパーソナライズに機械学習を取り入れて、ユーザーが最近よく「いいね!」をした人の投稿が多く表示され、交流が減った人の投稿はあまり表示されないようにしています。GPS ナビゲーションサービスでも、交通データの分析や通勤/通学経路の混雑予測に機械学習が利用されています。さらにメールのスパムフィルターでも、迷惑メールの判定に機械学習が使用されています。

ビジネス界にも機械学習の活用例はたくさんあります。たとえば、機械学習によって大量の顧客データからインサイトを導き出して、個人のニーズに応じたパーソナライズサービスを提供したり、お勧め商品を提案したりできます。医療や金融サービスのような規制の厳しい業界では、アクティビティレコードを分析して、不審なふるまいを検出する、不正を検知する、リスク管理を強化するなど、セキュリティの向上とコンプライアンスの徹底に機械学習が役立てられています。機械学習やその他の AI 技術は概して、リアルタイムのより正確な状況把握を可能にすることで、的確な意思決定をサポートします。

ビジネス分野ごとの AI の活用例をいくつかご紹介します。

カスタマーサービス:
  • AI を組み込んだチャットボットで顧客からの問い合わせに対応する
  • クレジットカードの不正使用をより高い精度で検知する
  • 顧客からのフィードバックやアンケート結果を分析する
セールス/マーケティング:
  • 履歴データと市場データから、より精度の高い予測を立てる
  • 顧客の連絡先情報を更新する/新しい見込み客を発掘する/見込み客のスコアリングを最適化する
  • メッセージをパーソナライズする/一連のコンテンツをキュレーションする
  • 顧客が望む情報を提供するデジタル広告プログラムを作成する
  • 競争環境や市場の状況に基づいて価格をリアルタイムで最適化する
オペレーション:
  • 需要と在庫を比較してサプライチェーン管理を最適化する
  • より効果的なリスク管理モデルを作成する
  • 請負業者からの提案書を自動的にレビューする
  • 異常な動作を特定して機器メンテナンスの負担を減らす
IT:
  • IT 運用とネットワークセキュリティを向上させる
  • 脆弱性を生むソフトウェアバグやマルウェアを検出してサイバー攻撃を防ぐ
  • 根本原因分析を自動化する

AI のリスク

AI については、知性を持った機械が人間の仕事を奪うのではないかと懸念する人がいます。また、機械が人間の指示を無視し、独自の判断で動くようになって、人間に危害を加えるのではないかと恐れる人もいます。2017 年の米国全米知事協会 (NGA) において、イーロン マスク氏は、「AI には人類文明の存在を脅かすほどの大きなリスクがある。それは、自動車事故、飛行機事故、不良薬品、ジャンクフードなどとは比べものにならない。もちろんこれらも社会の一部に悪影響を及ぼしているが、社会全体に害をもたらしているわけではない」と警告しました。また、科学者の故スティーヴン ホーキング博士は、2014 年の BBC のインタビューで、「完全な AI の開発は人類を滅ぼすかもしれない」と述べています。一方で、退屈な単純作業を自動化し、人間がより価値のある活動を行う余裕を作ることで AI が人生をより豊かにしてくれると期待する人もいます。

McKinsey 社は、2030 年までに 3 億 7,500 万人の労働者 (世界の労働人口の 14%) が、AI に仕事を奪われて職種の変更を求められると予測しています。ただし、AI は奪った数と同じだけの新しい職を生み出すという予測もあります。ガートナー社は、2020 年までに 180 万の職が AI に取って代わられると予測する一方で、その失われた 180 万の職は、同じく 2020 年までに新しく生み出される 230 万の職によって相殺され、結果的に 50 万の職が増えるとも予測しています。さらに ガートナー社は、2025 年までに 200 万の職が純増すると予測しています。

 

AI や機械学習を使用するべきかの判断

まずは、対象業務の複雑さを評価して、機械学習に投資する価値があるかどうかを判断することが重要です。AI は幅広い業務に適用できるため、AI の導入を検討する際は、他企業の類似業務での導入事例を調べると良いでしょう。

機械学習で一般的な用途の 1 つは、顧客データを解析して個人の好みや購買習慣など、自社との接点における顧客のふるまいを学習することです。この情報を利用すれば、メッセージ、サービス製品を顧客ごとに詳細にパーソナライズできます。これは、多くの企業と業界に合致する AI の用途です。

金融サービス業界では、クレジットカードの不正検知率の向上に機械学習が活躍し始めています。不正の手口は急速に巧妙化しているため、どれほど警戒を強めても人手では封じきれません。機械学習を取り入れれば、リアルタイムで状況に適応して、新しい手口でも高い精度で迅速に検出できます。金融業界や医療業界などの事例を見ると、機械学習はセキュリティやリスク管理に関するさまざまな課題の解決策として適していることがわかります。

機械学習が投資に値すると判断したら、次はデータについて検討します。機械学習の効果を得るには、大量のデータが必要です。そして、量よりも重要なのが質です。「ビッグデータよりもクリーンデータ」というのが多くのデータサイエンティストの共通意見です。どれだけ大量のデータがあっても、構造化されていなかったり無秩序であったりすれば、必要なビジネスインサイトは得られません。

さらに、データの新しさも重要です。多くの業界は急速に変化しています。わずか数年前のデータでも現在の業界の動向とはかけ離れていて、適切な予測値を割り出せない可能性があります。

機械学習の導入が初めてであれば、一般的に、教師あり学習から始めることをお勧めします。教師あり学習では、トレーニングを指導付きで行い、プロセスがわかりやすいため、多くの場合は AI の試験導入でもプロジェクトを管理しやすくなります。前述のとおり、機械学習で予測を行うには、その基となる既存のラベル付きデータが必要です。たとえば、クレジットカードの不正検知であれば、「不正」のラベルが付いたデータをその他の取引データと混ぜて使用することで、将来の不正取引を予測できるようになります。ラベル付きデータによる学習を行わないとプロセスがずっと複雑になり、結果が出るまでに時間がかかります。

導入が決まったら、まずは、2 カ月ほどの短い期間を設定し、少ないデータを使って、プロジェクトを開始します。特定の業務課題について、AI に対する質問を用意し、その答えに関するフィードバックを収集します。その結果に基づいて、対象業務で機械学習の効果がどのくらいあるかを評価するとともに、次に機械学習を試す、もう少し期間の長いプロジェクトを選びます。

use-ai-ml
AIとML(機械学習) の導入方法

AI を使い始めるには?

企業にとって AI を使い始める最善の方法は、既存の AI プラットフォームを利用することです。AI をゼロから作るには多大なコストと労力がかかることも理由の 1 つですが、さらに重要な点があります。それは、多くの企業にとって既存の AI プラットフォームを導入する方が簡単かつ効果的であることです。

企業ではすでに、誰もが技術的な詳細を意識することなく優れたテクノロジーを日々利用しています。日常業務を支えるメールクライアント、ワードプロセッサー、スプレッドシート、プロジェクト管理ソフトウェア、クラウドプラットフォームはいずれも、複雑なソースコードに従って動いていますが、コードを 1 行も知らなくてもほとんど何の問題もなく利用できます。現在では AI も、簡単に利用できるツールが普及したおかげで同じように導入できます。

これは「AI の民主化」と呼ばれ、現在では、業務ユーザーにとって優れた AI ツールを利用できる環境が整っています。実際、2019 年までに、セルフサービス型の分析ツールやビジネスインテリジェンス (BI) ツールを利用するユーザーの分析量がデータサイエンティストの分析量を上回るとガートナー社は予測しています

分析だけではありません。Google社、Amazon 社Microsoft 社など、大手のクラウドプロバイダーは、専門家でなくても独自の機械学習モデルを構築できるツールを提供して AI 活用の敷居を下げています。各社とも、開発経験がわずかでもすぐに AI を使い始められるように既製のアルゴリズムと使いやすいインターフェイスを提供して、導入のシンプル化を図っています。

 

中小企業でも AI を利用できるか?

中小企業でも、AI を活用してデータ主導型の企業になることができます。AI を利用した顧客リソース管理 (CRM) ツールを導入すれば、1 人のオーナーで経営していたとしても顧客のレビュー、ソーシャルメディアへの投稿、メール、アンケート回答などを解析して、サービスや製品のパーソナライズに役立てることができます。また、反復の多い作業の自動化も可能です。たとえば、カスタマーサービスで Digital Genius などの AI プラットフォームを使って、問い合わせに回答したり、サポートチケットを分類したりできます。Google Sheets や ZenDesk などの既存のツールと MonkeyLearn のような AI ツールを統合すれば、ツールからan AI tool like Monkey Learn.

 

データが少なくても AI を利用できるか?

社内に蓄積されたデータが少ない中小企業でも AI を利用できます。ソーシャルメディアのデータをソースから直接収集すれば、即座に分析できます。また、不動産業界で人気の高い、住宅価格を追跡および分析する AI アプリケーションでは、通常はさまざまな公開ソースから価格データが収集されます。

 

結論:今こそ AI を導入すべき時

人工知能と機械学習はもはや、スタンフォード大学や MIT で行われる難解なコンピューターサイエンス研究プロジェクトの枠にとどまりません。AI アルゴリズムは、チェスの世界王者との対戦や仮想パーソナルアシスタント以外にも用途が広がり、コグニティブコンピューティングが医療に変革をもたらし、自動運転する車の開発を後押ししています。AI の試験導入をためらっているのなら、心配は無用です。AI テクノロジーは今日、これまでになく低コストで簡単に利用できるようになり、その動きは今後も続くでしょう。