Googleクラウドでブコメのセンチメントを見るということをやっています。どんな文章がどんなスコアがでるか、ということをやってみたのでまとめ。
#対象ページ
分析対象にしたのはこちらの記事についたブコメです。
麻生太郎氏が一着35万円するスーツを着ていたと判明!TBSが報じ、ネットで話題に
現時点で300ブクマで200以上のブコメがついています。
個人の所感としては、「そんなことニュースにしなくてもいいし、もっと良いスーツかと思った。」と感じた次第です。
#分析結果のスコアを見てみる
記事についたブコメをセンチメント分析していきます。以下、結果を抜粋です。
よく分類できているなと感じたものは下記。
文章 | スコア | 分類 |
---|---|---|
いいスーツ着てない人が外交とかめまいがするから安心したわ。 | 0.9 | ポジティブ |
いや、そこは別にいくらのスーツ着てても好きにしていいです | 0.8 | ポジティブ |
オーダーで35万くらいって金銭感覚ちゃんとしてそう。 | 0.8 | ポジティブ |
日本の財務大臣が、一着3万5千円のスーツを着てるよりは遥かに良いニュース。 | 0.7 | ポジティブ |
いいことだと思う。身なり大事。 | 0.6 | ポジティブ |
へえー!さすが麻生さん、かっこいいですね | 0.5 | ポジティブ |
ま、アッコにおまかせなら別にいいんじゃない? | 0.1 | ニュートラル |
金持ちなんだからいいじゃん。 | 0 | ニュートラル |
もっと高いと思ってた。 | 0 | ニュートラル |
そこらの成金が霞むガチの名門の出なのになんの問題があるのか/親戚が皇族だわ先祖は明治の元勲やぞ。 | 0 | ニュートラル |
袈裟まで憎し論法は良くない金持ってるやつは使え。経済回せ。それと一連の問題の流れは別 | 0 | ニュートラル |
判明したから何だよ。クソ記事書いてんじゃないよ | -0.3 | ネガティブ |
だからなんやねん。 | -0.5 | ネガティブ |
麻生さんの場合、スーツ以外のところにもお金をかけているので……一式いくらするんですかね | -0.5 | ネガティブ |
うーん、このテレビ局の程度の低さときたら | -0.6 | ネガティブ |
報じる意図がわからない。 | -0.6 | ネガティブ |
別に放送では批判していたわけじゃないのに、勝手に批判していたと言ってTV局を叩くネット民。フェイクニュースに騙されんなよ | -0.6 | ネガティブ |
こういう、本筋と関係ないところでディスるのホント嫌い。 | -0.7 | ネガティブ |
こんな「叩いてくださいお願いします」みたいな釣り針に引っかかるブコメには幻滅した。 | -0.8 | ネガティブ |
結構分類できているかなあと思ったコメントです、個人的には、「スーツの値段は適正」「良いスーツを着るの良いこと」といったコメントはポジティブに分類されているなと感じました、また、「そんなこと報道するな」的なコメントはネガティブに分類されているようです。
そして分類できてないなという思った文章は下記
文章 | スコア | 分類 | 私の印象 |
---|---|---|---|
印象操作ってこうやってやるんだなー。ネットが普及して本当によかった! | 0.6 | ポジティブ | ニュートラル |
ワイドショーで好まれそうなネタ。こういうのを面白がるのは下品だけど、目くじらを立てるほどではないかと | 0.5 | ポジティブ | ニュートラル |
これで叩こうと思っているのならお笑いモノですね。 | 0.3 | ポジティブ | ネガティブ |
マスコミは批判するくせに50万以上のスーツ着てるぜ。 | 0.2 | ポジティブ | ネガティブ |
「TBSアッコにおまかせ!で放送された」和田アキ子の衣装は安いの? | 0 | ニュートラル | ネガティブ |
で? | 0 | ニュートラル | ネガティブ |
このお店、こんなのバラしたら太客逃すぞ。何考えてるんだと | 0 | ニュートラル | ネガティブ |
副総理が着るオーダースーツが1着35万円なんてむしろお買い得品だろ。 | -0.1 | ネガティブ | ポジティブ |
下世話な話。麻生大臣の無能や有害さとは何の関係もない | -0.1 | ネガティブ | ポジティブ |
“何か問題でも?” | -0.2 | ネガティブ | ポジティブ |
むしろ安くないか?、スーツは給与一月分が目安のはず | -0.2 | ネガティブ | ポジティブ |
あの人が安いの着てたらそのほうが問題だわ | -0.3 | ネガティブ | ニュートラル |
などです。分類できていないと思ったのは、テレビや報道を下げる批判は、逆に麻生大臣をポジティブに受け取るということになるので、ネガティブに多く、分類できいないなと感じました。傾向して、何かを批判して、何かのポジティブさを説明することはネガティブに分類されます。
(余談)
記事を書きつつ思ったのですが、この記事のブコメのポジネガを分類した時、ポジティブ10%、ネガティブ22%でした。自分的には35万のスーツに対しては賛成でしたので、ネガティブ多いのかーと思いました。しかし、ブコメにはいろんなものに対する言及が混ざっている状態です。麻生大臣への賞賛、スーツの妥当性、テレビ・報道への批判、などなど。「麻生大臣が35万のスーツを着ていること」を軸として考えるなら、テレビへの言及は一緒に計測するべきではないですね。
#スコアをよく見た感想
ある事柄(ニュースなど)に対する言及は、いろんな軸で言及されるため、文章を単純にセンチメント分析(ポジネガのスコアで見ると)、正確な分類になることはなさそうです。
今回分析したブコメでいうなら、「麻生大臣のスーツの金額に対してのセンチメント分析」はほとんど好意的な意見が見られますし、「スーツの金額を報道するテレビに対してのセンチメント分析」は、ほとんどネガティブな意見です。目視で見てもそうです。考えれば当たり前ですが、記事へのブコメは、コメントする人ごとに言及している対象が異なるという気づきはかなりいい発見でした。
ちなみに私の感想「そんなことニュースにしてくてもいいし、もっと良いスーツかと思った。」はスコア0.5です。
また、「そんなことニュースにしてくてもいいし」という文章は、語尾が変わるとスコアが結構変わることを発見しまして、
文章 | スコア | 分類 | 本当の感想 |
---|---|---|---|
そんなことニュースにしなくてもいいし | 0 | ニュートラル | ネガティブ |
そんなことニュースにしなくてもいい | 0.7 | ポジティブ | ネガティブ |
そんなことニュースにしなくていい | 0.7 | ポジティブ | ネガティブ |
そんなことニュースにしないで | -0.6 | ネガティブ | ネガティブ |
そんなことニュースにするな | 0.1 | ニュートラル | ネガティブ |
そんなニュースやめて | 0.7 | ネガティブ | ネガティブ |
となり、ネガティブな意見がポジティブとして捉えられてしまいます。「否定形+よい」という言葉が否定として分類できないのかなと思われます。「いい」という言葉に引っ張られてるのかなという印象です。
#まとめ
これからセンチメント分析をする際は、「何に対してのポジネガか」という軸も持たせてみようかなと思います。分析結果をみると、文章ごとのポジティブ・ネガティブはかなり精度高く分類できているかなという印象です。なので、その結果を整理して可視化できれば、、、、良いなと思います。