はじめに
本記事では、機械学習、データ分析、データ可視化、自然言語処理などデータ活用する分野において、“ポップ”なデータを活用した事例が紹介されているウェブサイトやブログの記事などを紹介します。そもそも“ポップ”とは何か。Weblio辞書では以下のように説明されています。
③広く大衆に受け入れられやすいさま。
つまり、広く大衆に受け入れられやすい内容(=ポップ)のデータを活用した事例を紹介します。今日、オープンデータとしてさまざまな内容のデータが公開されており、その中でもいわゆるポップなものもありますね。抵抗があるかもしれない機械学習、データ分析、データ可視化、自然言語処理などの理解に役立てると幸いです。本記事は、私自身の備忘録も兼ねているため、気まぐれで随時更新していきます。ご了承ください。自分としては、今後データを活用した“何か”を行うときの参考として蓄積していこうと思います。
もしよろしければ、これらと合わせてご覧ください。
↓
機械学習の参考リンク集
機械学習の用語集
ポップなデータ活用事例集
【Python】嵐の歌詞をWordCloudで可視化して、結成20年でファンに伝えたかったことを紐解いてみた - Qiita
キーワード
- 嵐
- 自然言語処理
- WordCloud
最近、公式SNSを解禁して話題の国民的アイドル「嵐」。結成からこれまで20年間でファンに何を伝えたかったのか?という筆者の疑問について歌詞データを分析することにより明らかにします。歌詞データ収集、形態素解析による歌詞の単語化、WordCloudによる利用頻度の高い単語の可視化までの方法を流れで学ぶことができます。筆者が参考にしている記事として、「米津玄師」の歌詞を可視化したものもありますね。(米津玄師の歌詞をWordCloudで可視化してみた。 - Qiita)
ポケモンデータ解析.py - Qiita
キーワード
- ポケモン
- データ分析
- Kaggle
近日、シリーズ最新作である「ポケットモンスター ソード・シールド」も発売した国民的ゲーム「ポケットモンスター(以下、ポケモン)」。この記事では、そんなポケモンのタイプや種族値などのデータを対象として、データ分析や機械学習を試行しています。基本的な流れをプログラムも添えてかなり大きいボリュームで紹介しています。ポケモンといった題材のチョイスもあってか、親しみやすく読み進めやすい内容です。また、トレーディングカードゲーム「遊戯王」を対象とした記事もありますね。(遊戯王データセット解析 - Qiita)
TensorFlowでポケモンの名前から種族値とタイプを予測させる遊び-Qiita
キーワード
- ポケモン
- 機械学習
- TensorFlow
既存ポケモンの名前と種族値やタイプを学習し、名前を入力することで種族値やタイプを予測するモデルを生成します。Googleが開発した機械学習のライブラリであるTensorFlowが利用されます。個人的にはサンプルとして存在しているポケモン“テンソルフロー”に興味があります。
ポケモンの外見的特徴から種族値を勾配ブースティングで予測する - Qiita
キーワード
- ポケモン
- 機械学習
- 画像処理
- 勾配ブースティング
上記の記事に対して、こちらは既存ポケモンの外見を学習して、種族値を予測します。途中、デジモンなどポケモンにおける種族値が存在しない画像から種族値を算出していたり、興味深い内容です。
上記の記事と組み合わせることで、オリジナルのポケモンの名前と外見が決まった場合に自動的に種族値やタイプを算出することができますね。個人的には名前から種族値を予測するモデルと、外見から種族値を予測するモデルをアンサンブル学習させても面白いかなと思いました。
人工知能でバレンタインチョコが本命か義理かを判別する - Qiita
キーワード
- バレンタインチョコ
- 機械学習
- 画像処理
- 畳み込みニューラルネットワーク
2月14日といえばバレンタインデー。 日本では、女性から男性へチョコレートを贈る日です。一方、男性にとって重要な課題として、本命チョコと義理チョコが判別できないという点が挙げられます。筆者はこのような社会的な問題に取り組みます。個人的にこの記事の興味深い点として、学術研究、論文のような流れ、表現がなされていることです。例えば、既存手法の問題点を挙げ、その解決として手法を提案している部分などです。大学生、大学院生で学術研究、論文の執筆に取り組む方にはそのような点も役に立つところがあるかもしれません。
おわりに
本記事では、機械学習、データ分析、データ可視化、自然言語処理などデータ活用する分野において、“ポップ”なデータを活用した事例が紹介されているウェブサイトやブログの記事などを紹介しました。本記事、および紹介した各記事を読むことによって、抵抗があるかもしれない機械学習、データ分析、データ可視化、自然言語処理の理解に役立てると幸いです。
もし、他にもオススメのウェブサイトやブログの記事などがありましたら、コメントなどをいただければ幸いです。
個人的にはこの記事を充実させるともにオリジナリティのあるポップなデータ活用に繋げられたらなあと思っております。![]()