はじめに
Qiita初投稿!
kaggleを巡回してたら面白そうなDataSetがあったのでpython使って分析します。
グラフ描画にはseaborn使います。
データセットについて
kaggleのPokemon with statsというデータセットを拝借。
import pandas
import seaborn as sns
import matplotlib.pyplot as plt
input = pandas.read_csv('Pokemon.csv')
input.head()
ちなみに「Bulbasaur」はフシギダネのことみたいです。日本名の面影がほとんどない。
続いて、基本統計量も見てみます。
input.describe()
今のポケモンって721匹もいるの?
昔、ポケモンの名前全部言う歌流行ってたけど、もう無理やな。
世代と種族値
今回のデータセットには第1~6世代までのポケモンのデータがはいっている。
ちなみにそれぞれゲームタイトルで言うと以下の通り。
・第1世代 赤・緑・青・ピカチュウ 151種類
・第2世代 金・銀・クリスタル 251種類
・第3世代 ルビー・サファイア・エメラルド・ファイアレッド・リーフグリーン 386種類
・第4世代 ダイヤモンド・パール・プラチナ・ハートゴールド・ソウルシルバー 493種類
・第5世代 ブラック・ホワイト・ブラック2・ホワイト2 649種類
・第6世代 X・Y・オメガルビー・アルファサファイア 719種類
sns.countplot(x="Generation", data=input)
sns.barplot(x="Generation", y="Total",data=input);
plt.show()
sns.barplot(x="Generation", y="HP",data=input);
plt.show()
sns.barplot(x="Generation", y="Attack",data=input);
plt.show()
sns.barplot(x="Generation", y="Defense",data=input);
plt.show()
sns.barplot(x="Generation", y="Sp. Atk",data=input);
plt.show()
sns.barplot(x="Generation", y="Sp. Def",data=input);
plt.show()
sns.barplot(x="Generation", y="Speed",data=input);
plt.show()
全体的に第4世代の能力の高さが目立ちますね。
タイプと種族値
sns.countplot(y="Type 1", data=input)
タイプ別データ数
水タイプが一番多く、次いでノーマル、草、虫と続く
sns.barplot(y="Type 1", x="Total",data=input);
plt.show()
ドラゴンがダントツですね。
sns.barplot(y="Type 1", x="HP",data=input);
plt.show()
sns.barplot(y="Type 1", x="Attack",data=input);
plt.show()
sns.barplot(y="Type 1", x="Defense",data=input);
plt.show()
sns.barplot(y="Type 1", x="Sp. Atk",data=input);
plt.show()
sns.barplot(y="Type 1", x="Sp. Def",data=input);
plt.show()
sns.barplot(y="Type 1", x="Speed",data=input);
plt.show()
まとめ
世代別にみると全体的に第4世代が強い。
タイプ別だと以下の通り
総合・・・ドラゴン
HP・・・ドラゴン
攻撃・・・ドラゴン
防御・・・はがね
特殊攻撃・・・エスパー
特殊防御・・・ドラゴン
すばやさ・・・ひこう
【結論】
ドラゴン強い。