概要
「〇〇で歌ってみた」は野球選手や駅名など特定ジャンルの名詞のみで元歌詞の音韻を模倣する替え歌です。
SNSや動画投稿サイトなどでしばしば盛り上がるこの種の替え歌ですが、どのような歌詞がより高い評価を得やすいのでしょうか?
本記事では、「野球選手名で歌ってみた」(通称「やきゅうた」)コンクールの提出作品を解析し、
- 文節や母音・子音の一致率
- 単語の長さ
といった作詞上の指標を比較してみました。
特に「子音一致率」が評価と関連がありそう、という示唆を得られたので、その結果をご紹介します。
背景
「〇〇で歌ってみた」は、野球選手や駅名、魚など特定ジャンルの名詞のみで元歌詞の音韻を模倣する替え歌です。
言語ユーモアの一種でs、その評価には以下のような課題があります。
- 再生数だけでは測りづらい
- 元曲の知名度に依存したり、投稿時期によって評価が変わってしまう。
- 客観的な評価指標が確立されていない
- 「面白い」「元曲にどれだけ忠実か」など、感覚的な部分が大きい。
一方で、「やきゅうた」には有志コンクールが存在し、参加者同士の投票による順位づけが行われることがあります。
特に「トーナメント杯」というルールでは同じ元曲を使い、さらに対戦形式で勝敗が決まるため、比較可能なデータがまとまって得られます。
替え歌研究としては、まさに理想的な条件といえます。
分析方法
分析対象
「第4回野球選手名で歌ってみたトーナメント杯」に提出された計46作品(のべ)から
- 1回戦
- 2回戦
- 3回戦
- 準決勝
に相当する42作品を対象にしました。決勝と3位決定戦は自由曲での対戦だったため除外しています。
指標の選定
替え歌作品を分析する上で、以下の4つの指標を主に計算しました。
- 文節一致率
- 元歌詞の文節(形態素解析で推定)と替え歌歌詞の単語境界がどれだけ一致しているか
- リズムのまとまりをどれだけ再現しているかの指標
- 母音一致率
- 元歌詞と替え歌歌詞で対応するモウラの“母音”が一致している割合
- 「あいうえお」と「ン」「ッ」「ー」(特殊モウラも便宜的に母音扱い)
- 音韻のうち母音をどれだけ再現しているかの指標
- 子音一致率
- 元歌詞と替え歌歌詞で対応するモウラの“子音”が一致している割合
- 音韻のうち子音をどれだけ再現しているかの指標
- 単語長
- 替え歌歌詞で使われる単語(野球選手の名前)の平均モウラ数
- 長めの単語(フルネームなど)を使うと面白さが出やすい一方で、音韻を合わせるハードルが上がるなどのトレードオフがある
解析にはPythonで書いたプログラムを用い、モウラごとの対応付けなどは自動で行いました。
人の感覚とズレる推定結果がゼロではなかったですが、数は少なかったので許容しました。
結果と考察
(1) 全体分析
データ量
分析対象42作品を通して、元歌詞と替え歌歌詞のモウラ数や単語数は以下でした。
- 元歌詞
- モウラ数: 12391
- 単語数: 6230
- 文節数: 3473
- 替え歌歌詞
- モウラ数: 14377
- 単語数: 4431
文節一致率
まず、元歌詞の文節と替え歌歌詞の単語の境界がどれだけ一致しているかを計算したところ、文節一致率は 0.575 でした。
一方、ランダムに単語を配置した場合の期待値を概算すると約0.357でした。
よって、観測値は期待値の2倍ほど(OE比 = 2.02)でした。
つまり、替え歌作詞者は文節の区切りを活かして単語を配置している傾向がうかがえます。
同じ要領で「元歌詞の単語」と替え歌歌詞の単語の境界の一致率を計算すると0.502と、文節よりやや低めでした。
これは文法上の「単語」よりも、自立語を中心とした区切りの単位である「文節」レベルで揃えるほうが自然に歌いやすいことの表れと考えられます。
母音・子音の一致率
次に、モウラごとに母音と子音がどれだけ一致しているかを計算しました。
- 母音一致率: 0.933
- 子音一致率: 0.461
母音が9割以上一致していることから、多くの作品で「元歌詞と同じ母音」にすることが大前提になっているようです。
一方、子音はそこまで高くはありませんが、それでも単純に1/30程度のランダム期待値と比べると大幅に高く、「できるだけ子音も揃える」意図がうかがえる結果となりました。
単語長
「長い単語を使うほど評価が上がりそう」という仮説があるものの、一方で文節や母音・子音を合わせる難しさも増すため、元歌詞の文節長と替え歌歌詞の単語長の分布を比較しました。
結果、替え歌単語はやや短めに分割されている傾向が確認できました。具体的には、元歌詞では3~4モウラが多いのに対し、替え歌歌詞では2~3モウラが多かったです。
長い替え歌単語(6〜8モウラなど)も一部に見られますが、全体的には短い単語を積み重ねることで文節や音韻を合わせやすくしている可能性があります。
指標間の相関
作品ごとに4つの指標を計算し、相関を見たところ
- 単語長と他の音韻的指標(母音・子音・文節一致率)は負の相関
- 母音一致率・子音一致率・文節一致率同士は無相関または正の相関
となりました。
単語を長くしようとすると音韻を再現しにくい(トレードオフがある)一方、母音・子音・文節といった音韻の再現に寄与する指標は、まとめて高められる人は高められるし、低い人は低い、というグループがあるようです。これは作詞者の技量やスタンス(面白さ優先/音韻再現優先)が作品に表れているとも考えられます。
偏相関を見ても概ね同じ傾向がありましたが、子音一致率だけは母音・文節との相関が一貫して低く(ときにわずかに負)、他の指標とはやや独立している様子が見られました。
(2) 高評価群 vs. 低評価群の比較
t検定
トーナメント形式での各対戦の勝敗をもとに、高評価群・低評価群に分割して各指標を単純に比較しました。p値の補正はしていません。
対応ありt検定の結果は以下のとおりです。
指標 | t統計量 | p値 | 平均_低評価群 | 平均_高評価群 |
---|---|---|---|---|
単語長 | 1.657 | 0.113 | 3.452 | 3.167 |
母音一致率 | -0.981 | 0.338 | 0.930 | 0.937 |
子音一致率 | -2.613 | 0.017 | 0.426 | 0.488 |
文節一致率 | -1.695 | 0.106 | 0.710 | 0.743 |
5%水準で有意差があるのは子音一致率のみでした(p = 0.017)。母音はどの作品も高めなので、作品間であまり差が出なかった可能性があります。文節はやや高評価群のほうが一致する傾向がありましたが、有意とはいえませんでした。単語長はやや低評価群のほうが長いという傾向がありましたが、有意とはいえませんでした。
重回帰分析
4つの指標を同時に説明変数とし、勝敗を目的変数とする重回帰分析も試みましたが、調整済みR^2は約9% と低く、モデル全体としてのフィットはあまり良くありませんでした。ただし個別係数の検定では、子音一致率のみ5%水準で有意が示唆されるなど、t検定と整合的な結果でした。
まとめと今後の展望
今回の解析から、
- 母音はほぼ確実に一致させるのが前提になっていて差がつきにくい
- 子音までしっかり揃えられる作品が評価されやすい(有意差あり)
- 単語長をむやみに伸ばさず、リズムや音韻を合わせることが優先されがち
といった傾向が見えてきました。ただし、子音一致率にも「母音ほど統一されていないからこそ逆に差が出やすい」という可能性もあり、どこまで実際に評価者が重視しているかは今後の検証が必要です。
また、今回は文字情報のみの分析のため、メロディや実際の歌われ方が作詞に与える効果はほぼ考慮できていません。「面白さ」の主観的な評価など、投票者・参加者の知識・好みといった要素もあるため、結果の一般化にはさらなる検証が必要です。
とはいえ、限定的かもしれない観点ではあるものの、替え歌を定量的に眺められたのはよかったです。今後は、
- より精度の高い音韻対応(子音の連続値的な類似度など)
- メロディ・アクセントとの整合性(歌いやすさ分析)
- そもそものネタ選び・意外性などの定量化(笑いの要素)
なども含めて研究を進めていければ、より包括的な理解につながるかもしれません。