内容
これまでアイデアレベルで、思いついては立ち消えしていた企画であるが、
試行錯誤の中で、ようやく薄っすらと方法論が見えてきた。
これまでの経緯
日本語読み歌詞WEB-API開発
ミスチルの歌詞を外国語で音読できないかの検討
方法論
音素分析
- 英語の「get on your case」というフレーズを、100回以上音読していると、最終的には日本語で「月曜 荷受け 椅子」と脳内変換できる。
脳内解析
- 自分の頭の中の処理を具体化すると、次のステップとなる。
1) 母音/子音 → 音声のつながりを正す
英語の語尾が子音で終わるが、これが続く単語の先頭と合体して日本語読みが構成される。
get on your case → ge tu you ni u ke i su → げつようにうけいす
2) カナ文字 → 漢字当てはめ
次にカナ読みに対して、漢字の語句を当てはめ、瞬時に日本語脳がはたらく当て字が付与される。
げつようにうけいす → 月曜 荷受け 椅子
課題感
- コーパス辞書なら テキストでよい → 英語をローマ字読みに変えるテキストAI
- 連文ならRNNか? BERTか? → 前後の語句のつながり学習が必要
- 音節を音声解析で変換するのがベスト → 音声解析に踏み込むのは、まだ時間がかかりそう
参考資料