機械学習の基礎を身につける上で、最も基本的な概念の1つが、教師あり(Supervised machine learning)と教師なし機械学習(unsupervised machine learning)です。このブログでは、教師あり学習と教師なし学習に関する概要から、イラスト、および事例を紹介し、機械学習に関する知識のレベルを上げることを目指します。
→ 機械学習の基礎知識: ガイドブックをダウンロードする
教師あり学習 VS 教師なしの機械学習
では、教師あり学習と教師なし学習を考えたとき、どのような違いがあるのでしょうか。
教師あり学習は、学習プロセスを指導してくれるマンツーマンの先生を持つようなイメージです。教師あり学習では、アルゴリズムにラベル付けされたデータを与えて学習させます。ラベル付きデータは教師(正しい解)として機能し、正しい出力がどうあるべきかの例をアルゴリズムに与えます。
教師あり学習は通常、新たな未知のデータに対して正確な予測を行うことを目的とする場合に使用されます。これは、アルゴリズムがラベル付きデータにアクセスすることで、入力データと出力データの間の基本的なパターンと関係を学習することができるからです。また、教師あり学習は解釈性が高く、アルゴリズムが特定の予測を行った理由を容易に理解することができます。
教師なし学習は宝探しのようなもので、地図は与えられているが、宝がどこにあるかは自分で探す必要があります。教師なし学習は、データのパターンや関係を特定することを目的とする場合によく使われます。教師なし学習は、大規模なデータセットを扱う際に、データのラベル付けに時間がかかったり、実用的でない場合に使用されることが一般的です。
教師あり学習の種類:
教師あり機械学習には、大きく分けて「分類」と「回帰」の2種類があります。
分類 (Classfication): 分類は教師あり学習の一種で、事前に定義されたカテゴリやクラスに基づいて、新しいデータがどのカテゴリやクラスに分類されるかを予測することを目的としています。
回帰 (Regression): 回帰では、1つまたは複数の入力変数に基づいて、連続的な出力変数を提供するモデルです。このモデルは、価格や温度などの数値を予測するために学習します。
教師あり学習のユースケース:
予測分析は、教師あり機械学習の最も一般的なユースケースの1つです。これは、株価、販売動向、顧客行動など、将来の出来事を予測するために過去のデータを使うことを含みます。
さらに、教師あり学習は、自然言語処理(NLP)により人間の言語を分析・理解するために使われています。NLPのアプリケーションには、感情分析、チャットボット、言語翻訳、テキスト要約などがあります。
時系列予測に関しては、時系列の過去の値に基づいて時系列の将来の値を予測するために使用されます。例えば、株価、収益予測、天候パターンなどの将来値を推定するためです。
教師なし機械学習の種類:
教師なし学習にはいくつかの手法がありますが、クラスタリングは教師なし学習で最もよく使われる手法です。クラスタリングとは、似たような特徴を持つデータポイントを自動的にグループ化し、「クラスター」に割り当てるプロセスを指します。
クラスタリングの実用的な例を見るには、「Clustering: How it Works (In Plain English!)」をご覧ください。
教師なし機械学習のユースケース:
教師なし学習(より具体的にはクラスタリング)のユースケースには、以下のようなものがあります:
- 顧客セグメンテーション: マーケティングやその他のビジネス戦略を構築するための異なる顧客グループを理解する
- 遺伝学:例えば、進化生物学を分析するためにDNAパターンをクラスタリングする
- 推薦システム:類似コンテンツをオススメで表示させるため、類似の視聴パターンを持つユーザーをグループ化する
- 異常検出: 不正行為の検出や機械部品の欠陥検出(例:予知保全)など
Dataikuで機械学習をやってみる
AutoMLによるノーコードから、フルコードで完全にカスタマイズ可能なモデル構築まで、Dataikuは、MLを作る過程でより多くのチームメンバーとコラボしながら、プロジェクトを進めることができます。モデルの説明可能性と解釈可能性のための機能は、モデルの結果を理解するのを手助けし、異なる変数がモデルのパフォーマンスに与える影響を把握することで、積極的に結果をモニタリングすることができます。
ディープラーニング、時系列予測、ジェネレーティブAIなどを使った高度なテクニックも使うことが可能です。
Dataikuの画像分類
さらに一歩先へ:Dataikuで取り組む機械学習(ML)
Dataikuの機械学習向け機能で、Everyday AIを実現する方法について、こちらのEbookを取得して、詳しく学ぶ。
原文: Supervised vs. Unsupervised Machine Learning: Use Cases & Examples