1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

【R・Mecab】自分と河野太郎さんのツイートをword_cloudしてみた

Last updated at Posted at 2020-06-11

(備忘用なので、時間あるときに分かりやすい記事にします。)

下記リンクを参照して、word_cloudしてみました。
https://qiita.com/Sota_N/items/dfd435c4ebee29e100f7

まず自分のツイートの結果
wordcloud_hikaru.png

反省点は
・取得するツイート数を500に設定し、リツイートを除外したのでサンプルが少ない。
・する、てるなどを除外するべき。
・そもそも私のツイートは具体的な名詞が少ないので、分析しがいがない

反省を生かし、防衛大臣の河野太郎さんのツイートを分析したのが下記。
taro.png

最近コロナウイルスの感染者等をツイートされているので、名が上位であることは納得。
河野さんくらい上位にヒットするワードが多いと傾向がつかめ、分析のしがいがあるといえる。

ちなみに私、河野さんの分析双方ともword_cloudするときに下記でfilterをかけている。

frq_Zimin_exp_taro <- frq_Zimin_taro %>%
  filter(Info1 %in% c("名詞","形容詞","動詞")) %>% 
  filter(Freq > 10) %>% 
  filter(!(Info2 %in% c("数", "サ変接続", "一般"))) %>% 
  filter(!(Term %in% c("する", "いる", "ある")))

最終的には
"#(ハッシュタグ)"や、特定の言葉を含むツイートを取得したいからまだ道のりはながい・・・

今日はここまで!

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?