はじめに
音素の類似性の定量化に関するサーベイの一環として以下の論文を読んだメモです。
Kawahara 2009: Calculating Vocalic Similarity through Puns (ダジャレから見る母音の近似性)
想像で補った部分がおおいので、間違いあるかもしれません。コメント歓迎です。
論文の概要(PaperInterpreterを一部使用)
タイトル: Calculating Vocalic Similarity through Puns (ダジャレから見る母音の近似性)
ジャーナル名 & 発行年: Journal of the Phonetic Society of Japan, Vol. 13 No.3, December 2009
著者: Shigeto Kawahara (川原繁人), Kazuko Shinohara (篠原和子)
所属: Rutgers University (ラトガーズ大学), Tokyo University of Agriculture and Technology (東京農工大学)
要旨:
この論文では、日本語のダジャレにおける母音対応の分析を通じて、母音の近似性について調査しました。第一に、各母音ペアが日本語のダジャレにおいて、どの程度期待を上回って発生しやすいか(OER)を具体的に計算しました。第二に、この結果が、既存研究からどのように説明されるかを議論し、弁別素性に基づく音韻的近似性だけでは説明できず、周波数特性に基づく知覚的近似性も含めて説明できる可能性があることを指摘しました。
背景:
この研究は、ダジャレや韻を踏む言葉遊びが音韻対応を形成する際に、音の対応が知覚的に近いものの間で起こりやすいという仮説に基づいています。これまでの研究で、知覚的類似性が言語のアートパターン形成において重要な役割を果たすことが指摘されており、その実証的検証を試みています。
方法:
本研究では、日本語のダジャレのコーパスからデータを収集し、母音の対応に関する統計的な分析を行いました。このコーパスデータは、日本のウェブサイトから収集されました。コーパスデータの家、母音が異なるダジャレの単語ペアを取得し、観測値/期待値(O/E)比率を計算しました。
結果:
異なる母音対のOERは以下の通りでした。例えばaとo、iとuなどのペアが期待を上回って観測されやすいことがわかります。
a | e | o | i | u | |
---|---|---|---|---|---|
a | 0 | 1.60 | 2.13 | 0.72 | 0.78 |
e | 0 | 0 | 0.74 | 1.90 | 0.55 |
o | 0 | 0 | 0 | 0.46 | 1.54 |
i | 0 | 0 | 0 | 0 | 2.06 |
u | 0 | 0 | 0 | 0 | 0 |
議論:
OERが高い母音対は知覚的な類似性が高いとしたとき、それが既存研究からどのように説明できるかを議論しました。その結果、弁別素性に基づく音韻的対応仮説よりも、周波数特性に基づく音声学的対応仮説のほうが本結果をよく説明できると結論付けられました。
QA(論文を理解するための前提知識)
弁別素性
弁別素性(distinctive features)は、言語の音声を分類するための基本的な属性または特性です。これらは個々の音(音素)を区別し、記述するために用いられます。例えば、母音においては高さ(high)、低さ(low)、後舌(back)、丸み(round)などの素性があります。
本論文ではDiscussionにて、先行研究に基づいて母音の弁別素性を以下の項目で整理しています。
a | e | i | o | u | |
---|---|---|---|---|---|
high | − | − | + | − | + |
low | + | − | − | − | − |
back | + | − | − | + | + |
rounded | − | − | − | + | + |
音韻的近似性
音韻的近似性(phonological similarity)は、二つの音声が共有する弁別素性の数に基づいて計算されます。
知覚的近似性
知覚的近似性(perceptual similarity)は、人間が実際に聞いた際の音声の類似度に基づいています。これは音声の物理的な特性、例えば周波数の特徴や音の持続時間など、実際の聴覚情報に基づいて測定されます。
本論文では、先行研究に基づいて、各母音のF1-F2空間におけるユークリッド距離、あるいはF1同士、F2同士の距離などから知覚的近似性を議論しています。
以下、論文より引用です。
Table 6: The distance matrix between the five vowels.
a | e | o | i | u | |
---|---|---|---|---|---|
a | 0 | 3.89 | 3.51 | 5.61 | 3.64 |
e | 0 | 0 | 6.13 | 2.01 | 3.47 |
o | 0 | 0 | 0 | 7.08 | 3.41 |
i | 0 | 0 | 0 | 0 | 3.81 |
u | 0 | 0 | 0 | 0 | 0 |
Table 5: F2 and F1 of /a,o,e/ in Japanese.
F2 (Hz) in Nishi et al. | F2 (Hz) in K&H | F2 (Bark) in H&K | |
---|---|---|---|
a | 1182 | 1383 | 9.80 |
o | 805 | 1136 | 6.97 |
e | 1785 | 1720 | 13.10 |
|a-o| | 377 | 247 | 2.83 |
|a-e| | 603 | 337 | 3.30 |
F1 (Hz) in Nishi et al. | F1 (Hz) in K&H | F1 (Bark) in H&K | |
---|---|---|---|
a | 615 | 631 | 6.75 |
o | 430 | 481 | 4.68 |
e | 437 | 475 | 4.69 |
|a-o| | 185 | 150 | 2.07 |
|a-e| | 178 | 156 | 2.06 |
Table 7: F2 and F1 of /i,u,e,o/ in Japanese.
F2 (Hz) in Nishi et al. | F2 (Hz) in K&H | F2 (Bark) in H&K | |
---|---|---|---|
i | 2077 | 1954 | 13.80 |
u | 1171 | 1419 | 10.00 |
|i-u| | 906 | 535 | 3.80 |
F2 (Hz) in Nishi et al. | F2 (Hz) in K&H | F2 (Bark) in H&K | |
---|---|---|---|
e | 1785 | 1720 | 13.10 |
o | 805 | 1136 | 6.97 |
|e-o| | 980 | 584 | 6.13 |
F1 (Hz) in Nishi et al. | F1 (Hz) in K&H | F1 (Bark) in H&K | |
---|---|---|---|
i | 317 | 359 | 2.81 |
u | 349 | 405 | 3.12 |
|i-u| | 32 | 46 | 0.31 |
F1 (Hz) in Nishi et al. | F1 (Hz) in K&H | F1 (Bark) in H&K | |
---|---|---|---|
e | 437 | 475 | 4.69 |
o | 430 | 481 | 4.68 |
|e-o| | 7 | 6 | 0.01 |
QA(論文での新規情報)
コーパス作成時、収集対象サイトはどのように選定したか。具体例は。
- 「ダジャレ」「ギャグ」などのワードでGoogle検索しヒットした17のダジャレまとめサイトを収集対象とした
- URLのリストはAppendixに記載されている。例えばダジャレナビなどのサイト。
ダジャレ単語ペアをどのような基準で取得したか
- 収集対象サイトからダジャレ文を取得した。このとき、ダジャレを構成する2つの単語が明に含まれ、それらの単語に異なる母音が含まれるもののみを対象とした。
- 上記を満たすダジャレ文から対応する異なる母音のペアを収集した
作成されたコーパスの母音ペア総数は?
論文の表1より以下の通り。
O-values | a | e | o | i | u | total |
---|---|---|---|---|---|---|
a | 0 | 71 | 93 | 37 | 36 | 237 |
e | 0 | 28 | 84 | 22 | 68 | 202 |
o | 0 | 20 | 61 | 56 | 50 | 187 |
i | 0 | 0 | 0 | 95 | 36 | 131 |
u | 0 | 0 | 0 | 0 | 214 | 214 |
また母音1つずつの発生頻度に基づき、各ペアがランダムに生起するとしたときの頻度は同じく表1より以下の通り。
E-values | a | e | o | i | u |
---|---|---|---|---|---|
a | 0 | 44.4 | 43.8 | 51.1 | 46.4 |
e | 0 | 0 | 37.9 | 44.2 | 40.1 |
o | 0 | 0 | 0 | 43.6 | 39.5 |
i | 0 | 0 | 0 | 0 | 46.2 |
u | 0 | 0 | 0 | 0 | 0 |
Discussionで論じていた内容とその結果
ダジャレコーパスによればaとeよりもaとoが対応付けられやすい。しかし、弁別素性に基づけばaとeのほうがaとoよりも近似性が高い。一方、周波数特性でみると、F1-F2空間上でのaとoの距離はaとeよりも近い。iとuについても似たような議論をおこなっている。これらの議論から、周波数特性のほうがダジャレにおける母音の対応付をうまく説明できる可能性がある、と結論付けている。
おわりに
音素の類似性に関するサーベイの一環として論文を読んでみました。具体的な数値データに興味があったので、なるべく本記事に記載するようにしました。
IntorductionやDiscussionは言語学の基礎知識が不足していたので正直あまり理解できていません。また機会があれば読み込んでみたいと思います。