プロローグ
1年間に発売されたライトノベルのタイトルを、AIテキストマイニングで分析してみた|岡田勘一[編集者・ライター]|note
が気になった。
この方は
AIテキストマイニング by ユーザーローカル
というwebサービスを利用しているが、
やっぱCUIでやりたいじゃないっすか。ね。
参考にしたもの
【コード公開】【Python】テキストマイニングしてみた〜ジョブズのスピーチでWordCloudを作ろう | Analytics Board | python特化のプログラミングサイト
source
https://github.com/tknr/text_mining
本体はこんなに短い。
#!/usr/bin/python
# coding: utf-8
from wordcloud import WordCloud
text_file = open("src.txt")
bindata = text_file.read()
txt = bindata
wordcloud = WordCloud(background_color="white",
font_path="HackGenNerd_v2.5.1/HackGenNerd-Regular.ttf",
width=800,height=600).generate(txt)
wordcloud.to_file("./result_wordcloud.png")
今回は
小説・文学通販ランキング - honto
2021/09/05 時点 集計期間:1ヶ月 100位まで の書籍タイトルをターゲットにやってみました
結果
$ bash setup.sh
$ time ./text_mining
real 0m4.377s
user 0m4.228s
sys 0m0.492s
散っとるのお。
エピローグ
えー... 便利な世の中になったものです。
幡随院先生、逮捕状です
巡査 なんたら
A:○○くぅ~ん
B:なんスかうっとーしーなーもぉーっ
A:あいつさぁ、もっと簡単に出来るの知らなかったんだよ
B:何がぁ?
A:あんなのさぁ、コード書かなくたってさぁ、
wordcloud_cli --text mytext.txt --imagefile wordcloud.png
A:ほらな?出来るでしょ?
B:...出力見てみてよ、ほらぁ
A:何が?
B:全部□じゃん。日本語フォント食わせてないでしょ?
A:...ぐうぅぅぅっ
(A、Bの方にすがりながら退場)