こんにちは!中学生でも分かるようにわかりやすくAIやデータサイエンスの用語を解説するシリーズ!
今日は「デンドログラム」という、ちょっと不思議な名前のグラフについて、中学生でもわかるようにやさしく説明します。
「デンドログラム」は、AIやデータ分析の世界でよく使われるグループ分け(クラスタリング)を見える化した図です。でも、難しく考えなくて大丈夫!
木の形をした図を見ながら、友達グループを分けるイメージで理解してみましょう!
以下のYouTube動画でも解説していますのでチェックしてみてください!
👨👩👧👦 データの「仲良しグループ」を見つける!
まず、「クラスタリング」って言葉を聞いたことはありますか?
これは、似ているもの同士をグループに分けることです。
たとえば、学校のクラスの中で、
- サッカーが好きな人
- アニメが好きな人
- 勉強が得意な人
こんなふうに共通点でグループを作ることってありますよね?
AIやコンピュータも、データを見て「この人とこの人は似ているな〜」と感じたら、同じグループにまとめてくれます。
🌳 デンドログラムは「仲良しグループの木」
デンドログラムは、そんなグループ分けを「木の形」で見えるようにした図です。
▼ イメージしてみよう
- 最初は、すべての人がバラバラ。
- 似ている2人を線でつなげて「ミニグループ」を作る。
- ミニグループ同士をさらにつなげて、少し大きいグループに。
- 最後は、全員がひとつの大きな木のようにつながる。
このように、デンドログラムは木の枝のように、だんだんつながっていくグループ分けの様子を表しています。
🧠 実際に使う場面って?
デンドログラムは、AIやデータサイエンスの世界でいろいろな場面で使われます。
💡 たとえば:
- 商品のおすすめ機能で、「似たような買い物をする人」を見つけたいとき
- 動物や植物を「種類別」に分けるとき
- テストの点数で、「似た傾向の成績の生徒」を分けるとき
など、「似ているもの同士を見つける」場面で大活躍です!
🔍 どうやって作るの?
では、どうやって似ている人を見つけるのでしょうか?
たとえば、以下のようにABCという3人がいて、それぞれ国語の点数と数学の点数が以下の通りだったらどうでしょう?
名前 | 国語の点数 | 数学の点数 |
---|---|---|
Aくん | 80点 | 60点 |
Bくん | 82点 | 89点 |
Cくん | 50点 | 90点 |
国語の点数だけならAくんとBくんが近いのはわかるのですが、国語の点数と数学の点数をあわせるとどうなるでしょう?
これを可視化するために国語の点数をX軸、数学の点数をY軸にプロットすると以下のようになります。
そして、それぞのユーザーの距離を計算してみましょう!
距離の計算方法はいくつかあるのですが、一般的なのはユークリッド距離。各点の直線距離を計算します。
結果は以下のようになります。
結果的にAくんとBくんの距離が最も近くなりました。
よってAくんとBくんを同じグループにするわけです。
このようなプロセスを繰り返して、グループにしていくのです。
✅ まとめ
用語 | 意味 |
---|---|
クラスタリング | 似ているものをグループに分けること |
デンドログラム | グループ分けの様子を木の形で見せてくれる図 |
使いみち | AIの分析、動物の分類、ユーザーの傾向チェックなど |
🌟 おわりに:デンドログラムは「見える化の天才」
難しそうに見える「デンドログラム」も、身近な友達グループのように考えるとわかりやすいですね。
「似ている人をまとめる」→「つながりを木で表す」→「パッと見て分かりやすい!」
そんな便利な図が、デンドログラムです。