こんにちは、学びの探求者です。
普段はnoteで活動しています。
2025年のQiitaアドベントカレンダーでは、
「ノーコード/ローコードで、自分のコンテンツ基盤を自動化していく」
をテーマに、25日間の仕組みづくりを記録していきます。
ぜひ、応援してください。
Day9 で WEST. の全楽曲データ(singles / albums / setlists) を整理し、
「ライブでどれぐらい歌われているか(live_count)」を取得しました。
Day10 は、このデータを使って、
ライブで歌われる“人気度”を数値化する指標(LPI)を作る回 です。
今日のゴール
songs データに
- age(曲の年齢)
- live_rate(ライブ登場頻度)
- decay(時間係数)
- lpi(Live Popularity Index)
を追加し、
Day11 以降の「セトリ予測モデル」につながる基盤を完成させること。
1. 曲の“年齢”を計算する(age)
age = 2025 - release_year
曲が古いほどライブ回数が自然と増えるので、
年齢はあとで“補正”に使いやすい指標になります。
2. ライブ登場頻度(live_rate)
live_rate = live_count / age
例えば、11年間で25回歌われた曲は
live_rate = 25 / 11 = 2.27
かなり登場頻度が高いことがわかります。
3. decay(時間による経過補正係数)
decay(経過補正)とは、曲の“古さ”を考慮するための調整値です。
古い曲はライブで歌われる回数が自然と増えるため、
そのまま live_count を使うと人気が過大評価されてしまいます。
そこで、今回は仮に 0.1 を設定し、
live_rate を decay で割って “ライブ人気指数(LPI)” を計算しています。
decay = 0.1
本当は、最新曲に強い補正をかける、ツアー構造を反映するなどしたいのですが、
Day11 以降で調整したいと思っています。
## 4. LPI:Live Popularity Index(独自人気指標)
最終的に作った指標はこちら
lpi = live_rate / decay
live_rate を decay で割ることで
「ライブでよく歌われる曲 ≒ 人気曲」という指数になります。
5. songs シートの完成例
やはりデビュー曲「ええじゃないか」は強いです♪
丸め処理を入れたことで、
一気に “分析しやすいスコア表” に変わりました。
Day10 のまとめ
- 曲の年齢 × ライブ回数で “人気の傾向” が見えるようになった
- LPI で、曲ごとに「歌われやすさ」を数値化できた
- この指標が、明日以降 セトリ予測アルゴリズムの中心 になる
次回 Day11 予告:
曲データから“セトリ予測モデル”を本気で作りたい!!!
- LPI 上位曲のランキング
- 過去ツアーの構造から補正を追加
- データ × AI のハイブリッド予測へ
ぜひ、応援してください。
