spotifyのAPIを使ってヒット予測を作ってみました。
今回はまず取り掛かりの第一回目として、
1.過去のランキングデータを取得
2.取得したランキングデータをまとめてグラフ化
をやっていきます。
##1.過去のランキングデータを取得
https://spotifycharts.com/regional
から日本の日別トップ200ランキングを取得しました。
過去数日ないとランキングの推移が出せないので、ここでは2020年7月1日〜7月13日のデータを取得しています。
このcsvを元にランキングのグラフを作っていきます。
##2.取得したランキングデータをまとめてグラフ化
jupyter Notebookを使って作業していきます。
細かい詳細は省きますが、以下手順で行いました。
###・csvを一つにまとめる(ヘッダーあり)
csvを一つのフォルダに入れてfor文で「pd.read_csv」で読み込みをファイル文ループ。
2回目以降のヘッダーは読み込まずにそのまま縦方向に追加していく。
読み込みが終わったらdataFrameで扱いやすいようにリストを作ります。
ひとまず確認。
X軸に日付、Y軸に再生回数を積んだグラフですが、なんとなくは思っているような出力ができそうです。
###・ランキング推移を知りたい楽曲を入力
csvからのリストは膨大な楽曲数になるため、そのままランキンググラフ化するとカオスになります(笑)
そこで、必要な(知りたい)楽曲だけを抜き出し、ランキング推移を表示する方法を取りました。
###・グラフ化
ここまでくればもう一息。あとはグラフ化するだけです。
多少細かい調整が必要ですが、このようなグラフで表示させることができました。
NiziUは7月1日〜13日の期間、上位にはいますが、7月9日から少し順位を下げているのがわかりますね。
次回はより高度にランキングデータを取り、ランキング予測をしたいと思います。
ではまた!