初めに
私が良くyoutubeで見ている「ゆる言語学ラジオ」というチャンネルの動画を見ているとこんな一幕がありました。
「濁音は強いイメージを、半濁音はかわいいイメージを与えやすい」
だから、ロングセラーのお菓子の名前はパピコ
や アポロ
などの半濁音が入りやすいし、怪獣の名前はゴジラ
やバラモン
などの濁音が入っていることが多いそうです。
また、ポケモンの名前でも伝説のポケモンはグラードン
やディアルガ
など濁音が入っていることが多いし、マスコットキャラであるピカチュウ
には半濁音が入っています。
そこで私は
かわいいポケモンはかっこいいポケモンよりも弱いイメージがあるから、
名前に半濁音が多いポケモンはステータス上弱くなる傾向にあるのでは?
と疑問に思ったので、軽く統計を取ってみることにしました。
ドメイン知識
ポケモンのステータスは「HP」「こうげき」「ぼうぎょ」「とくこう」「とくぼう」「すばやさ」の6種類で示されています。
これらは内部ではポケモンの種類ごとにそれぞれどのステータスが高くなりやすいかという情報が数値で与えられている。これをネット上では種族値(非公式名称)と呼んでます。
今回の調査では、6種類の種族値を合計した「合計種族値」をポケモンの強さの指標として用いました。
例えば、冒険の序盤に手に入るピカチュウの合計種族値は320となっており、伝説のポケモンと呼ばれるグラードンの合計種族値は660となっています。
実装
概要
今回の調査では、「名前に含まれる濁音・半濁音の個数毎にグループを作り、グループごとの平均合計種族値を比較する」ことで名前とステータスの関連性を考察します。
PokeAPI
# 指定したポケモンの情報を取得
response = requests.get("https://pokeapi.co/api/v2/pokemon/" + str(id)).json()
# 名前の取得
name = response['name']
# 合計種族値の取得
sum_stat = 0
for stat in response['stats']:
sum_stat += stat['base_stat']
ポケモンの名前やステータスのデータを手に入れるにあたって、PokeAPIを利用しました。
データ取得の実装説明に関してはほぼ以下の記事を参考にしたため割愛させていただきます。
今回はポケモンの名前と種族値にアクセスするために使いましたが、他にもタイプだったり図鑑の説明までデータがあるのでいろいろな使い方が出来そうです。
ただ、上記のコードではポケモンの名前が英名で取得されるため以下の記事を参考に日本名で取得するように改良しました。
濁音・半濁音の判定
import pykakasi
kakasi = pykakasi.kakasi()
kakasi.setMode('K', 'a')
# 「ッ」の削除
text = text.replace("ッ", "")
# ローマ字変換
kakasi.convert(text)[0]['hepburn']
pykakasiを用いてポケモンの名前をローマ字に変換した後、濁音と半濁音に相当するg,z,d,b,pがいくつ含まれているかを数えました。また、このやり方では「ッ」が含まれる場合に二重にカウントしてしまうことが考えられるので、ローマ字変換する前に「ッ」を除外するという処理を挟みました。
(後から考えたら、文字コードで範囲参照するなどもっといいやり方があった気がします...)
これらを基に、PokeAPIにデータが載っている全てのポケモンの名前を濁音・半濁音の数毎にグルーピングして、各グループの平均種族値を算出しました。
結果
各グループごとに集計した結果が上のグラフです。
緑のグラフが濁音・半濁音の無いグループ、赤が濁音が含まれるグループ、青が半濁音が含まれるグループを指しています。
私の予想では緑を境に赤の値が高く青の値が低くなると考えていましたが、一概にそうとは言えない結果となりました。
この結果から考察を軽く並べると
- 濁音がついているポケモンは何もついていないポケモンより強くなる傾向にある
- 半濁音がついているからと言って弱くなるわけではないが、半濁音が2つ含まれるポケモンは明らかに種族値が低くなる傾向にある(例:ピッピ、ププリン)
- 濁音が4つ含まれるポケモンの平均が特に高そうに見えるが、該当ポケモンが1匹しかいないため(ドドゲザンのみ)単にデータ不足と考えられる
補足
今回は集計から除外しましたが、濁音と半濁音が混在するポケモンももちろんいます。
その中で面白かったのは濁音2つ半濁音1つのグループで、"ブーピッグ"と"ブリザポス"の2匹しかいません。
平均種族値が525と圧倒的でした。(外れ値なため、平均が偏っている感はありますが)
最後に
言語学も統計学も知識が浅いので込み入った考察などはできませんでしたが、そこそこ有意な結果が得られて良かったです。
そもそも、ラジオの中でこの話が出てきた経緯は「なぜ、おかしの名前はパピプペポが多いのか? 言語学者、小学生の質問に本気で答える」という書籍の中に含まれている話が元となっているので、こちらの文献を読んで言語学側の知識も深めたいです。