#LINEのグループ会話ログを分析したら面白そうだったので作ってみた
LINEの会話ログを解析するためのプログラムです.
以前この記事でも同じようなものを作っていますが,今回のバージョンでは
発言のポジティブ度判断機能と感情解析機能が付きました!
このプログラムに会話ログを読み込ませることでそのグループで行われた会話の解析を行うことができ,
長期間会話しているグループで解析を行うと面白いと思います
gitにソースをあげました
LineAnalyzerの中に入っているLineAnalyzer.javaがメインファイルです.
git hub
詳しい利用方法は下の方に書きました><
##このプログラムを利用するとLINEグループの会話ログを分析して遊べます
###出来ること
1.ユーザーごとの発言回数のカウント
2.頻出単語の集計
3.ユーザーごとの発言のポジティブさの判定
4.ユーザーごとの感情値の解析 (10項目)
#出力結果の一例(各項目の解説)
##1.ユーザーごとの発言回数のカウント
そのLINEグループで各ユーザーが何回発言したかをカウントすることができます.
//スマートフォンから送信したLINEの会話ログファイルのパスを記述
WordCounter counter = new WordCounter("./src/javatest/log2.txt");
counter.showPersonMap(0);
counter.getPersonMap();
-------------------------------
発言数ランキング
-------------------------------
Y.A : 336
ロレンス : 423
山田 太郎 : 688
##2.頻出単語の集計
頻出単語の集計では全ての会話に対して形態素解析を行い,
その後その単語が何回出現したかをカウントしています.
//スマートフォンから送信したLINEの会話ログファイルのパスを記述
WordCounter counter = new WordCounter("./src/javatest/log2.txt");
//ここの引数は単語の出現回数が○回未満だった場合に表示しないという設定が可能 (未記入でもおk)
counter.showWordsMap(5);
counter.getWordMap();
-----------------------------
利用頻度の高い単語ランキング
-------------------------------
魔窟 : 56
時間 : 57
お願い : 59
そ : 59
プラス : 63
ゼウス : 66
カーリー : 75
スキル : 75
ポチ : 78
スタミナ : 90
闘技 : 93
継承 : 94
マルチ : 102
() : 115
こと : 117
体 : 122
そう : 123
₊₂₉₇ : 144
それ : 157
俺 : 200
お : 275
スタンプ : 300
さん : 322
笑 : 528
画像 : 568
ビルド成功(合計時間: 1秒)
##3.ユーザーごとの発言のポジティブさの判定
これに関してはRikyuを用いて感情解析を行っています
https://github.com/YoshiteruIwasaki/rikyu
発言した内容がポジティブかネガティブかという判定を行っています.
-----------------------------
発言のポジティブ度合い
-------------------------------
Y.A : 35
山田太郎 : 48
ロレンス : 49
##4.ユーザーごとの感情値の解析 (10項目)
あらかじめ定められた10個の感情値に関連する発言を行ったら1とカウントし
各ユーザーの発言した内容から感情を解析することができます.
この10個の感情一つ一つには数百以上の感情に関するそのキーワードが登録されており,
その単語と発言内容がマッチングした際に1点とカウントしています.
ここにあるTypesのファイル内のテキストファイルを書き換えることで,感情ファイルを増やすこともできます
今は10感情ですが,新しいテキストファイルをこのディレクトリに追加し,そのテキストファイルにその感情に関する単語を
手入力で入れるとその感情の解析も行うことができるようになります.
https://github.com/keisuke2236/LineLogAnalyzer_Java/tree/master/Types
-----------------------------
発言者ごとの発言感情分析
-----------------------------
-----------------
Y.A
-----------------
aware : 0
iya : 7
yasuraka : 2
kowai : 1
suki : 2
yorokobi : 4
haji : 2
takaburi : 0
ikari : 2
odoroki : 1
-----------------
山田 太郎
-----------------
aware : 2
iya : 39
yasuraka : 2
kowai : 4
suki : 8
yorokobi : 7
haji : 0
takaburi : 4
ikari : 3
odoroki : 1
-----------------
ロレンス
-----------------
aware : 2
iya : 7
yasuraka : 4
kowai : 1
suki : 1
yorokobi : 6
haji : 0
takaburi : 2
ikari : 1
odoroki : 1
##jarファイルで必要なやつ DL必須!
lucene-gosen-4.4.0-ipadic.jar: 形態素解析ライブラリが必要です
kuromoji-0.7.7.jar :kuromojiが必要です
両方ともダウンロードしてプロジェクトファイルのプロパティーからjarファイルの追加をしましょう.
私の開発環境はMacbookのNetBeansです.
#使い方
初めにスマートフォンのLINEの設定から会話ログを送信し会話ログをPCに移します.
WordCounter.javaが解析を行うメインのプログラムファイルになり,
このファイルの21行目
WordCounter count = new WordCounter("./src/javatest/log2.txt");
この文字列の部分が会話ログをしているためのファイルパスになっていますので
スマートフォンから送られてきたテキストファイルのファイルパスをそのままここに書きましょう.
あとは適当にWordCounter.javaの中にあるメソッドを上記の解説で出した感じで使うとプログラムが解析してくれます!
count.showFeelingMap();
count.showFeelingMap();
count.showPersonMap(0);
count.showPositive();
count.showWordsMap(5);
#使っている他のプログラム様
すでにこのプログラムの中に入っていますがrikyuを利用しています
https://github.com/YoshiteruIwasaki/rikyu