予測分析とは、過去の行動パターンを特定し、将来の成果を予測するために、大量のデータに数理モデルを適用する手法です。
データマイニング、機械学習、統計アルゴリズムの組み合わせがもたらす「予測的」要素により、予測分析ツールは単純な相関付け以上の機能を実行できます。ビジネスでは、予測分析が以下のようなさまざまな用途に利用されています。
予測分析を組み込んだソフトウェアが増えてきており、あらゆる規模の組織でユーザーにとって身近なものになりつつあります。予測分析はデータサイエンスや高度な分析に関する訓練を受けていないユーザーにも実務上の価値をもたらし、まさにすべてのユーザーが恩恵を受ける機会を提供します。このトレンドはしばしば「データの民主化」と呼ばれます。これは、誰もがデータを利用してより良い意思決定を下せるように、組織全体でデータを利用できるようにするという概念です。
以下では、予測分析がなぜ重要なのか、機械学習やデータマイニングなどの他のテクノロジーとの関係、モデルの役割、予測分析を始めるにあたってのヒントについて見ていきます。
予測分析を利用すると、企業や組織は実際のデータに基づいて重要な意思決定を下したり、考えられる結果を予測したりといったことを、これまで不可能だった規模で実行できるようになります。企業が生き残れるかどうかは、顧客のニーズを満たしながら、予測、計画、運用を効率的に行えるかどうかにかかっています。直感や推測、過去の情報に頼って人々が求めているものを憶測し、新製品の発表などの重要な決定を下した企業は、数十億ドルもの損失を被ったり、破綻に追い込まれたりしています。
データアナリティクスには、記述分析、予測分析、処方的分析という3つのタイプがあります。
予測分析がもたらす結果
21世紀の人間の活動は、そのほとんどすべてにおいてデータが生成されるため、ほぼすべての企業、組織、業界が、予測分析から価値を引き出すことができます。ここでは、考えられる何百もの予測分析のユースケースからいくつかをご紹介します。
予測分析は、リスク評価から顧客関係の強化まで、銀行や金融サービス活動のあらゆる領域で役立ちます。予測分析は以下のような目的で使用されます。
オンラインショップでも実店舗でも、小売業者は在庫と物流を管理する必要があります。予測分析ツールを使用すると、小売業者は過去の販売データ、購買習慣、地理的嗜好、さらには気象データといった大量の情報を相互に関連付けてパフォーマンスを最適化できます。
医療における予測分析:
医療専門家は、世界的な疾患統計、薬物相互作用、個々の患者の病歴などを利用して、優れた医療を提供し、より効率的かつ効果的な病院運営を行えるようになります。
高度に自動化された最新の工場では、予測分析ツールを使用して、設計、購買、生産、品質管理、在庫管理、配送など、製造プロセスの各ステップを監視し、最適化できます。
消費者が目にする場所はどこも広告やマーケティングで溢れ返っており、消費者の注意を引き、それを維持することはこれまで以上に難しくなっています。
皆さんはデータの増加に関する多くの統計を耳にしたことがあるでしょう。マーケットインテリジェンス企業であるIDC社の2018年の調査によれば、世界中で生成されるデータは2025年までに163ゼタバイト(ZB)まで増加すると見込まれています。これは、2017年に生成されたデータ量の10倍です。その主な推進要因がIoT(モノのインターネット)です。Intel社によれば、2006年のコネクテッドデバイスの数は世界で20億台程度でした。2020年には、その数が2,000億台に上ると見込まれています。これらの各デバイスが生成するデータは、優れた顧客サービスの提供、ネットワークの最適化、マーケティングメッセージの効果的なターゲティング、データセキュリティの向上など、さまざまな用途に使用できます。
予測分析の価値は、データの増加とともに高まり続けています。何十億もの人々、デバイス、ネットワークによって日々生み出される膨大な情報は、人間の脳だけでは対処できない課題と機会を生み出しています。予測分析はビッグデータの可能性を実現する大きな一歩であり、データを分析して将来の結果を予測するという前例のない能力を提供します。
予測分析は、データや分析に関する発展途上のその他のテクノロジーと混同されがちです。予測分析と混同されることの多いテクノロジーは、機械学習、予測モデリング、データマイニングの3つです。
アルゴリズムは予測分析の数学的な基礎です。レシピのように一連の手順で構成されており、結果を達成したり問題を解決したりするために実行されます。問題を解決するためにアルゴリズムをどのように適用するかを定義するのがモデルです。モデルとは、質問や、その質問に答える際に考慮する変数を定義するフレームワークです。アルゴリズムとは、変数を重み付けし、答えに辿り着くために使用する手順です。
Webを少し検索すると、多くの人々が「アルゴリズム」と「予測モデル」という言葉を混同して使っていることがわかります。また、「分類子」という言葉も同じ文脈で使用されています。言葉は流動的なものですが、「分類子」は一般に、分類のために特別に設計されたアルゴリズムを示すために使用されます。
予測分析でよく使用される一般的なモデルは、分類アルゴリズムと回帰アルゴリズムです。
予測分析で最も一般的に使用されるモデル
予測分析でよく使用される一般的なモデルには、線形回帰、ロジスティック回帰、線形判別分析、判定ツリー、Naive Bayes、k近傍法、サポートベクターマシン、ランダムフォレスト、ブースティングなどがあります。それぞれのモデルについては、以下で詳しく説明します。
データサイエンティストは、達成したい結果のタイプに基づいてさまざまな予測モデルを使用します。各アルゴリズムの計算は複雑なためこの記事では扱いませんが、ここでは代表的な予測分析アルゴリズムをいくつかご紹介し、その使用方法について簡単に説明します。
銀行や金融サービスにおける予測分析:予測分析は、リスク評価から顧客関係の強化まで、銀行や金融サービス活動のあらゆる領域で役立ちます。予測分析は以下のような目的で使用されます。
ニューラルネットワークとは
ニューラルネットワークは、人間の脳の機能に似せて設計された数理モデルです。ニューラルネットワークは、1つ以上の変数が不明な場合にデータの非線形関係を発見したり、複雑なパターン認識問題を解決したりするのに役立ちます。自動運転車はニューラルネットワークに依存しています。なぜなら、自動運転車は膨大な量のデータを瞬時に分析して運転に必要な決定を下さなければならないためです。
データアナリシスとは、データを分析してそこから結論を引き出すプロセスのことです。また、データアナリストが行う仕事とも言えます。データアナリティクスとは、データを特定、分類、整理することであり、分析できる状態にするために使用されるさまざまな手法の総称です。
最適な予測分析ソフトウェアとは、特定のニーズと予算に最も適合するソフトウェアです。予測分析ツールには、以下のようにさまざまな種類があります。
この分野の認知度が高まり、広く普及したことで、予測分析やその各種バージョンを自社のツールに組み込むソフトウェアベンダーが増えています。購入者にとっての課題は、そのツールが実際に予測分析を提供しているのか、基本的なアルゴリズム機能のみを使用しているのか、あるいはただ予測分析という言葉を使っているだけなのかを見極めることです。
さらに、多くのソフトウェアプラットフォームが自社のソリューションのさまざまな要素に予測分析を組み込んでいます。製品ポートフォリオには、予測分析が組み込まれたソリューションが含まれている場合もあれば、予測分析が必要でない機能を実行するソリューションが含まれている場合もあります。つまり、ベンダーが予測分析を持っていると言っても、実際にはそうではない場合もあれば、特定の製品にのみ組み込まれている場合もあります。
予測分析を使い始める方法
予測分析を使い始める最善の方法は、解決できる問題とできない問題を把握し、解決すべき最もクリティカルな問題を定め、スキルとテクノロジーのギャップを見極め、パイロットプロジェクトを実施するためのプランを作成することです。
予測分析はもはや新しい科学ではありません。あらゆる規模の企業や組織が、ビジネス上の最大の問題を解決するために使用している実用的なツールです。選択肢の検討段階から既存の実装の微調整まで、予測分析の導入がどの程度進んでいるかに関係なく、この目まぐるしい分野の変化を常に把握しておくことが不可欠です。
組織が必要としているのは、複雑でカオス化していたデータをリスクなしでスムーズにチャンスへと変えるアプローチです。そこでプロセスマイニングが役立ちます。何よりも重要なのは、分散していて無関係に見える情報を分析して相関付け、弱点を特定し、速やかにアクションをとるために適した方法だという点です。スプレッドシート上のプロセスの問題を解決するために数時間、数日、あるいは数週間を無駄にする代わりに、適切なプロセスマイニングツールを導入すれば、データをより効果的に使用して、ビジネス価値を高めることができます。組織内でカオス化していたデータを扱うという気が重い作業から脱却し、効率的な方法を導入して、何倍もの成果を手にしましょう。
予測分析の詳細、および予測分析をITインフラストラクチャに適用する方法については、「インフラ監視:予測と防止の基本戦略」および「リアクティブから予測的ITへ」をダウンロードしてご覧ください。