##はじめに
音楽を愛するエンジニアの皆さん、こんにちは。
自分の好きなアーティストっぽい歌詞が自動で作れたら楽しそうですよね。
ということで、__それっぽい歌詞ジェネーレータ__と題して作っていきます。
(Webスクレイピング学習の備忘録です。クオリティ等は期待しないでください。
Python・プログラミング初心者さんの学習の参考になれば幸いです。)
##機能のイメージ
アーティストとテーマとなる単語を設定すると、そのアーティストがそのテーマで作ったっぽい歌詞が生成される。
【例】
アーティスト:BUMP OF CHICKEN
テーマ:筋トレ
⇛BUMP OF CHICKENが筋トレをテーマにして作ったっぽい歌詞が生成される。
##仕組み
- Pythonで歌詞サイトから対象アーティストの歌詞情報をスクレイピングし、頻出単語などの"クセ"を抽出。
- テーマの周辺キーワードを取得。(Wikipediaに登場する単語や一緒に検索されている単語など)
- 歌詞情報+周辺キーワードから歌詞を生成。
PythonはGoogleが提供している__Google Colaboratory(Colab)__というサービスから実行する想定です。
__Colab__はGoogleアカウントさえあれば誰でも簡単にWebブラウザからPythonを実行できるサービスです。環境設定が不要なため、とっかかりにはオススメらしいです。
歌詞の著作権について
歌詞はアーティストの著作物ですので、むやみにスクレイピングしまくるのはどうかと思い、著作権周りについて調べてみました。
【スクレイピングと法律】スクレイピングって法律的に何がOKで何がOUTなのかを弁護士が解説。【2019年12月6日加筆】
こちらのサイトによると、解析用にデータを収集することは問題ないようです。
他のサイトから情報を読み込んで自サイトに表示するなどすると、著作権侵害にあたるそうです。詳しくはリンク先を御覧ください。
##最後に
次回から実際にコーディングを絡めながら動かしていければと思います。
Colabよりおすすめのサービスがあるよとか、著作権危ないよとかご指摘があればお待ちしております。