発端
mecabとword2vecの勉強してたときに歌詞を解析してみたら面白そうと思ったので調べてみた。
何故BUMP OF CHICKENについて調べるのか
インタビュー等で昔から同じことばかり歌っていると答えていたりするので、本当にそうなのか確認してみようと思った。
調査方法
word2vecの導入記事を丸パクリ参考にして、コサイン類似度を求め、各曲の類似度を求めた
歌詞の収集
歌詞を手入力するのが面倒なので、裏技でコピペして歌詞を収集した
また、BUMPにはオーイエアハーンと呼ばれる呪文?があるが今回はこちらは考慮しないものとしてます
選曲は筆者の独断と偏見で以下の曲としている
- ガラスのブルース
- K
- 天体観測
- 車輪の唄
- 才悩人応援歌
- いか
- 宇宙飛行士への手紙
- ray
- Butterfly
- 新世界
- 流れ星の正体
こういう作業を自動化できれば、勉強が捗りそうだ...
結果
値が1に近いものほど類似度が高いことになります。
ガラスのブルース | K | 天体観測 | 車輪の唄 | 才悩人応援歌 | いか | 宇宙飛行士への手紙 | ray | Butterfly | 新世界 | 流れ星の正体 | |
---|---|---|---|---|---|---|---|---|---|---|---|
ガラスのブルース | 1 | 0.84541 | 0.858023 | 0.836621 | 0.795154 | 0.737943 | 0.873139 | 0.851502 | 0.860159 | 0.864065 | 0.869405 |
K | - | 1 | 0.862597 | 0.851521 | 0.789107 | 0.67672 | 0.871507 | 0.809932 | 0.852617 | 0.876622 | 0.885764 |
天体観測 | - | - | 1 | 0.878975 | 0.878975 | 0.670639 | 0.891976 | 0.880697 | 0.882241 | 0.894482 | 0.914874 |
車輪の唄 | - | - | - | 1 | 0.83053 | 0.647024 | 0.862762 | 0.83085 | 0.850564 | 0.872001 | 0.893903 |
才悩人応援歌 | - | - | - | - | 1 | 0.625754 | 0.896517 | 0.840825 | 0.867586 | 0.826822 | 0.876386 |
いか | - | - | - | - | - | 1 | 0.699905 | 0.658228 | 0.68191 | 0.657326 | 0.694159 |
宇宙飛行士への手紙 | - | - | - | - | - | - | 1 | 0.933604 | 0.926521 | 0.901072 | 0.93485 |
ray | - | - | - | - | - | - | - | 1 | 0.915938 | 0.900616 | 0.907601 |
Butterfly | - | - | - | - | - | - | - | - | 1 | 0.881321 | 0.931756 |
新世界 | - | - | - | - | - | - | - | - | - | 1 | 0.921659 |
いかは類似度低いですね