今回はロジスティック回帰を紹介します。
目次
・ロジスティック回帰とは
・[AI on Browserで動かしてみる](#AI on Browserで動かしてみる)
・実装コードの確認
・利用例
ロジスティック回帰とは
予測結果を確率の形で求めることのできる分類モデルの一種です。
分類モデルとは
分類モデルとは、予測したい値がどのクラスに分類されるかを判別するモデルのことです。
この時、予測したい値を目的変数と呼び、判別材料として用いる変数を説明変数と呼びます。
例えば、
ガン患者と健常者についての、喫煙歴とアルコール摂取量のデータを所持しているとき
説明変数:喫煙歴、アルコール摂取量
目的変数:ガンになるかどうか(なるかならないかの二値)
として、喫煙歴とアルコール摂取量を用いて、「ある患者がガンになるかどうか」を予測することができます。
ロジスティック回帰とは
ロジスティック回帰では、予測結果を確率として考えることができます。
通常の分類モデルでは「ガンになるかならないか」のどちらに属するかを予測するのに対して、ロジスティック回帰の場合は「ガンになる確率」を予測することにより分類を行います。
ロジスティック回帰の式は
$$y = \frac{1}{1+ \exp( - (\alpha + \beta x))}$$
と表すことができます。
$y$は目的変数(予測結果の確率値)、$x$は説明変数です。
$\beta$は回帰係数と言い、それぞれの説明変数への重みを表す数値です。
最終的には予測した確率に基づいて、分類を行います。
AI on Browserで動かしてみる
AI on Browserで実際にロジスティック回帰を動かしてみます。
実装コードの確認
AI on BrowserのコードはGithub上に公開されており、ロジスティック回帰についてもコードの確認を行うことができます。
利用例
ロジスティック回帰は、前回とりあげたRidge回帰などのように「数値」を予測するわけではなく、「〇か×か」というような分類を行う手法となります。
予測結果が確率値に基づく分類として得られるという特徴があります。
例えば、マーケティングのシーンでは、商品購入者の属性やサイトの閲覧履歴から、「商品購入につながるか」の予測を行うこができ、より良いマーケティングの戦略を立てる指標として利用することができます。
また、顧客情報を用いて貸し倒れのリスクを予測することで、ローンの審査などにも利用されているようです1。