LightGBMの特徴量重要度とは？初心者向けに徹底解説！

Posted at 2024-12-21

機械学習の中でも高いパフォーマンスを誇るLightGBM。このアルゴリズムを使うとき、「特徴量重要度（Feature Importance）」という言葉をよく耳にします。この記事では、LightGBMの特徴量重要度について、中学生でもわかるように簡単に、さらに具体的な計算方法まで詳しく解説します！

1. LightGBMとは？

LightGBM（ライトジービーエム）は、データからルールや傾向を学び、問題を解決するための機械学習アルゴリズムです。例えば、テストの点数を予測する場合、「勉強時間」や「過去のテスト結果」などのデータから未来の結果を予想する手助けをします。

特徴量とは、データの中にある「ヒント」のようなものです。例えば、テストの点数を予測するとき、次のような情報がヒントになります。

これらを機械学習では「特徴量」と呼びます。

一方、特徴量重要度は、「どのヒントがどれだけ役立ったか」を数値化したものです。これにより、モデルが予測する際にどの特徴量が重要だったかが分かります。

LightGBMでは、特徴量重要度を算出する方法がいくつかあります。以下では、具体的な計算方法を解説します。

この方法では、特徴量が「決定木の分割に使用された回数」を重要度とします。

$
\text{Feature Importance (Split)}_j = \sum _{t \in T} 1(f_t = j)
$

単純で分かりやすいですが、同じ特徴量が何度も使われる場合、過大評価される可能性があります。

情報利得（Gain）は、分割により損失関数がどれだけ改善されたかを示す値です。この改善量を重要度として計算します。

$
\text{Feature Importance (Gain)}_j = \sum _{t \in T_j} \Delta \text{Loss}_t
$

モデルの性能向上に寄与した度合いを反映しているため、非常に実用的。ただし、値の大きい特徴量が過大評価されることがあります。

カバー（Cover）は、分割時にどれだけのデータが関わったかを示す指標です。

$
\text{Feature Importance (Cover)}_j = \sum _{t \in T_j} w_t
$

各分割でカバーされたデータ量を重視するため、実際のデータ分布を反映した重要度を算出できます。

LightGBMは、上記の各計算を決定木ごとに行い、それをすべての木で合計します。具体的には、次のような流れです。

最終的に、モデルにどの特徴量が重要だったかを示す「ランキング」が得られます。

特徴量重要度は、モデルの解釈や改善に非常に役立ちます。以下はその具体例です。

LightGBMの特徴量重要度は、「どの特徴量がモデルにとって重要だったか」を可視化する便利なツールです。特に以下の3つの計算方法を理解しておくと、LightGBMを使いこなせるようになります。

これらを活用して、より効果的な機械学習モデルの構築を目指しましょう！