4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

Splunk Advent Calendar 2019Advent Calendar 2019

Day 4

Beatlesの数々の名曲から頻度の高い単語をWordCloudで可視化(makemv, mvexpandコマンド編)

Last updated at Posted at 2019-12-03

きっかけ

  • 映画Yesterdayを見て、Beatlesの音楽を懐かしむ
  • 形態素解析でおしゃれなことをする記事を発見
  • まずは英単語なら簡単に区切ることができると考え手っ取り早くword cloudで可視化してみた

で、こんなアウトプットを用意してみた。

Nov-14-2019 23-20-29.gif

利用するもの

How to

1. bealtesの歌詞がすべて記載されたlookupファイルをSplunkに登録

  • beatles-lyrics.csvファイルをインポート
スクリーンショット 2019-11-14 23.06.13.png

スクリーンショット 2019-11-14 23.04.12.png

  • lookupの定義
    • |inputlookupコマンドでサーチできるようにするためにlookup定義を設定

スクリーンショット 2019-11-14 23.08.07.png

  • lookup file editorでフィールド名とか任意に変更

    • lylicsのフィールド名を扱いやすいsongに変更した
      スクリーンショット 2019-11-14 23.11.09.png
  • |inputlookupコマンドでデータcheck
    スクリーンショット 2019-11-14 23.09.32.png

2. SPLを使って可視化

  • とりあえず全部まとめたら以下のSPLです
| inputlookup beatles
| table song
| makemv delim=" " song
| mvexpand song
| stats count by song
| sort 200 - count

ポイント①: makemv

  • songのフィールドの中身をスペース区切りで分ける

スクリーンショット 2019-11-14 23.15.41.png

ポイント②: mvexpand

  • songのフィールドに複数の値が入っているものを1つ1つのイベントに分ける(パット見上と変わりないが、1イベントごとに別れています)

スクリーンショット 2019-11-14 23.17.22.png

  • 後は全部まとめて、完成
    スクリーンショット 2019-11-14 23.24.52.png

チューニングポイント

  • この単語外したいなと思ったら、以下の行をサーチに追加
| search NOT song IN (you,to,the,I,and,a)
  • 少し中身が変わりました。

スクリーンショット 2019-11-14 23.24.13.png

英語はスペースで区切れるので比較的簡単にwordcloudにして可視化できます.

次は日本語を使った形態素解析にチャレンジした話もいずれどこかで載せます。

スクリーンショット 2019-11-14 22.26.51.png

4
1
3

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?