相変わらず自然言語のAPIをつかってみています。どこまでできるかを把握するという意味で、分析しては結果をみて、分析しては、、、ということを繰り返しています。
先日の記事で、自然言語APIで京都の良い回しを感情分析してみた結果 という記事の中で、センチメント分析は皮肉の分析がそんなに得意じゃなさそうということを思ったのですが、日本語でなく、英語の皮肉はどのくらい分析できるのかなと思い調べて見ました。
参考:
・「嫌味」の英語!さりげなく悪口を言いたい時のネイティブ表現17選!
・英語の意味に裏がある「嫌味や皮肉で使われやすい」基礎表現
こちらを参考にさせていただきました。
#英語の皮肉表現を分析してみた
参考サイトから分析してみた結果は下記です。例文は基本的にネガティブな文章なのですが、スコアやいかに。。
例文 | スコア |
---|---|
Mom…THANKS A LOT! Don’t ever come into my room. お母さん…本当にありがとう!二度と部屋に入ってこないで。 |
0 |
Well, thank you for your help! That was fantastic! そうね、手伝ってくれてありがとう!素晴らしかったわ! |
0.6 |
You were supposed to bring me food! Thanks for nothing! 私に食べ物を持ってきてくれる約束だったでしょ!何にも感謝できないわ! |
-0.4 |
Thank you for being so condescending. とっても見下してくれてありがとう。 |
-0.6 |
I ate your ice cream for you so that you won’t get any fatter than that. You’re welcome. あなたがそれ以上太らないように、あなたのアイスクリーム食べといてあげたよ。どういたしまして。 |
0 |
Looks like I overestimated the number of your brain cells. 君の脳細胞の数を多く数え過ぎてたみたいだ。 |
-0.1 |
I can find my own way somehow, thank you very much. どうにかして自分で自分の道は探すからね、ありがとう(余計な口出しは無用だよ) |
0.7 |
Thanks a lot, you spoil the mood. 感謝するよ、君のおかげで雰囲気が台無しだ |
0.5 |
Thanks to you, we all missed the last train. みなさんのおかげでプロジェクトを終えられました |
0.6 |
という感じです。概ね、皮肉や嫌味はポジティブ表現として捉えられてしまうようです。前後の文脈ありきで皮肉や嫌味は成立するので文章を抜き出して判断するのは、難しいのかもしれません。
皮肉を計測するにはどうしたらいいか
そもそも皮肉とは、逆のリアクションをおおげさに表現することで成り立つものなのかなと思います。「冗談だろ!?俺の人生を完璧にしてくれてありがとう!」こちらとか、この言葉の前にネガティブな言葉があったら、皮肉になるし、ポジティブな言葉があったら、そのままの意味に捉えて問題ないと思います。なので、前後の文章を判断して、ネガティブから急にポジティブに振り切る文章は「皮肉」という判断もできるのではないかなあと思いました。
グーグルセンチメント分析のクセ
クセというか特徴というか。グーグルの分析は2つ以上の文章をまとめて、全体でポジティブかネガティブかというものを出しますが、例えば「お母さん…本当にありがとう!二度と部屋に入ってこないで。」このように、ポジティブ文章、ネガティブ文章、という組み合わせ場合、全体としてニュートラルと判定される傾向があるように思います。ポジティブ(+)とネガティブ(ー)で相殺されるイメージです。
本来ならこの文章は嫌味なので、-0.9くらいのネガティブとして判定して欲しいなと。しかし、文章全体としては、0:ニュートラルとして評価されています。
極端なネガティブからポジティブへの振り切りは、単純な感情の足し算にはならないので、評価ロジックが必要かなと思います。
(余談)
その感情の振れ幅が大きいことがmagnitudeっぽいですね、その数値で判断できるのかな。と思いました。
まとめ
英語でも皮肉や嫌味はセンチメント分析するのが難しいようでした。日本語だけ不得意ということではありませんでした。
前後の文脈とmagnitudeを駆使して、正解に近づく分析ができればいいなーと思っております。magnitudeに期待してます。