RPScala 温泉ハッカソンでWikipediaから声優のデータを集計するプログラムを書きました。ソースコードはもう少し整理したら公開します。
公開しました。http://qiita.com/takezoux2@github/items/5abd406cb13e24e9a6c4
最近声優の調査をする機会があり、声優の出演数をいろいろ調べようと思ったのですが、なかなか良いサイト見つからなかったので自分で集計しちゃいました。
2chは流石としか言いようが無いぐらいちゃんと集計されています。(むしろ、集計結果の確認に使いましたw)
2ch
http://wc2014.2ch.net/test/read.cgi/voice/1451499666/l50
naverまとめ(2chの転載?)
http://matome.naver.jp/odai/2145012246068771001
集計方法
Wikipedia(2016/3/6のダンプデータ)の各声優のページのうち、"テレビアニメ"セクションに記述されているものを集計しています。
また、集計対象は、Category:日本の女性声優に列挙されている声優を対象にしています。
また、メインキャラであるかどうかは、声優ページのキャラクター名の表記が太字になっているかどうかで判定しています。
データ
2015年出演数ランキング
2015年メインキャラ数ランキング
他にもいろいろ集計データ作っていくつもりです。他に欲しい集計データとかあれば要望にお応えします。
また、一部で集計ミスが残ってるかもしれません。本数などでミスがあれば教えてもらえると嬉しいです。