GoogleHome

GoogleHomeのPlayMusicで374の音楽ジャンルを調査して分かった知見

こんにちは。こちらはActions on Google Advent Calendarの16日目の記事です。

前書き

Play musicと連携済みのGoogleHomeでは「ねぇGoogle。{音楽ジャンル名}をかけて」で特定のジャンルの曲を再生できます。

自分は音楽に疎いため、ジャンル指定の語彙が全くないです。
そこでイイカンジの音楽が聞けるジャンルを調べるために、Wikipediaにある音楽ジャンル一覧を元に、しらみつぶしに調査しました。

調査結果の詳細は以下のblogにまとめました。

http://kbn1053.hatenablog.com/entry/2017/12/11/000439

この記事では、調査中に気づいたこと・分析などの内容をまとめます。

分かったこと

  • 有効な曲ジャンルは231件
    • 誤認識で指定が困難だったのはそのうち7件
    • 曲を探しました→再生します→スミマセン、エラーが発生しましたがそのうち4件
      • PlayMusic側の不具合?Googleにフィードバック送信済み
    • ジャンルカバー率61.8%
  • ライブラリに無い、または無効な指定の曲ジャンルは143件
    • 誤認識で指定が困難だったのがそのうち13件
    • 完全に誤認識でジャンルを指定できないのがそのう5件
    • わけわからんことになるのがそのうち3件
  • ジャンル名の認識精度
    • 認識に問題ないケースは92.5%
    • 誤認識されるケースは7.5%
      • もうちょっと高いと思ってたけど、そこそこ程度な認識精度。
  • 「{音楽ジャンル名}の曲をかけて」と「{音楽ジャンル名}をかけて」だと後者の方が再生してくれる可能性が高い
  • 音楽再生中はジャンル名の認識精度が落ちる
    • 特にロックやメタル再生中だとウェイクワードすら反応しにくい
  • XXmusicやXX歌というジャンルは内部的に「XX」として処理されているようだ。
    • 例えば、讃美歌でジャンル指定すると「賛美を探しましたが、見つかりませんでした」となる。
  • 長いジャンル名の方が認識精度が高い、逆に2文字のジャンル名は低いと感じる
    • 音声認識処理では、単語数が多いほうが正答しやすい?
  • 音声認識では同音異義語が非常に厄介そう
    • 例えばジャンル名「タンゴ」が「単語」、「フォークロック」が「4クロック」で認識されてしまうなど
  • 短いインターバルでGoogleHomeに何度も命令すると挙動が怪しくなることがあった
    • 「ねぇGoogle」で反応した直後、すぐ受付終了する
    • スピーカーからブチッという異音
    • 何度呼び掛けても無視される
      • 累計600ジャンル以上調査したのでGoogleHomeに嫌われた可能性は若干ある😿

誤認識の例

頑張れば認識されたジャンル😅

  • サルサ
    • 「寒さ」と誤認識されやすい
  • スカ
    • 「ガラ、母」と誤認識されやすい
  • ドゥームメタル
    • 「ドゥー」の発音が難しい。認識されにくい
  • トリップホップ
    • ホップが「POP」に認識されやすい
  • ノイエドイベチュレ
    • ロイエドイベ中などに誤認識。
    • 発声が難しい単語。自分の活舌のせいかもしれない。
  • ニューフォーク
    • ニューヨークに誤認識されやすい
  • マキナ
    • マッキナに誤認識されやすい
  • 明楽
    • 音楽に誤認識
  • ライ
    • Lineに誤認識

かなり認識が厳しいジャンル😰

  • サディコ
    • 「radico」と非常に誤認識されやすい
  • アラブミュージック
    • ラブ、アラームに誤認識。
    • 誤認識でラブソングがかかるので迷惑👹
  • ガバ
    • ガーバー、カバーに誤認識
  • スクリーモ
    • スクリームに誤認識。
    • わかる。
  • タンゴ
    • 単語に誤認識
  • フォークロック
    • 4クロックに誤認識
  • ホーミー
    • 4、ホームと誤認識
  • マンボ
    • アーティスト名のMan_booが再生されてしまう
  • ミュジークコンクレート
    • ミュージックコンクレートに誤認識
  • ヤンクロック
    • 4オクロックに誤認識

どうしても認識されない!😱

  • アフロハウス
    • フルハウスに誤認識され、「Cast対応アプリが見つからない…」
    • ドラマのフルハウスを探す処理に入っている?
  • ソカ
    • 「楚歌を再生します」
    • ジャンルのソカと発話では区別できない。これは技術的に困難そう。
  • ドゥームコア
    • ルームコアに誤認識。
    • どーしても無理だった
  • ネオアコースティック
    • ネオが音を、音音と誤認識される
  • ファド
    • 音、ハートに誤認識
    • 3語しかない。ファがどうにも音声認識されにくい。

わけわかんない動作をするジャンル🎃

  • 「ねぇGoogle。オリエンタルメタルをかけて」
    • 「オリエンタルメタル(株)の電話番号は・・・・」
      • 電話機能無いはずなのに…
  • 「ねぇGoogle。スキンズをかけて」
    • 「Cast対応アプリが見つかりません」
      • 単語の「スキンズ」は認識されている。映画・動画でそういった名称のものがあるのか?
  • 「ねぇGoogle。チャマメをかけて」
    • 「6件以上見つかりました、第1は流山市の[住所]にある茶豆蘭です」
      • なにがどうなってるか不明。

今回調べられなかった部分

  • GoogleHomeのPlayMusicオススメジャンルトップ10!
    • Qiitaにふさわしくない
  • 音声学観点からの認識されづらい単語の調査
    • なんとなくハ行とファ行が認識やばそうだなーという感じがありました

終わりに

VoiceUIやるときには日本語固有の問題が潜んでそうで、かなり大変かもしれないですね。
少なくとも同音異義語がある単語を避けるような設計が必要と感じます。

本調査では、GoogleHomeに人間が呼び掛けて調査しました。正直キツかったので二度とやりません😷
Action on Googleでの開発においても、デバッグする場合も人間がいちいち発話してやるのはあまり良い方針ではないでしょう。
Simulatorでのデバッグ、または『好きな言葉で呼びかけられるGoogle HomeをDIYする』でやられているように、iPhoneからの音声読み上げ、windowsからの棒読みちゃんに発話させる等、人間の労力を減らすようなプロセスにしていくことが大切でしょう。

さて、Actions on Google Advent Calendarの17日目はtocieさんです。
ではまた。