LoginSignup
2

More than 1 year has passed since last update.

CUIでのテキストマイニングって簡単になったなぁと感嘆

Last updated at Posted at 2021-09-05

プロローグ

1年間に発売されたライトノベルのタイトルを、AIテキストマイニングで分析してみた|岡田勘一[編集者・ライター]|note

が気になった。

この方は
AIテキストマイニング by ユーザーローカル
というwebサービスを利用しているが、
やっぱCUIでやりたいじゃないっすか。ね。

参考にしたもの

【コード公開】【Python】テキストマイニングしてみた〜ジョブズのスピーチでWordCloudを作ろう | Analytics Board | python特化のプログラミングサイト

source

https://github.com/tknr/text_mining

本体はこんなに短い。

#!/usr/bin/python
# coding: utf-8
from wordcloud import WordCloud

text_file = open("src.txt")
bindata = text_file.read()
txt = bindata

wordcloud = WordCloud(background_color="white",
    font_path="HackGenNerd_v2.5.1/HackGenNerd-Regular.ttf",
    width=800,height=600).generate(txt)


wordcloud.to_file("./result_wordcloud.png")

今回は
小説・文学通販ランキング - honto
2021/09/05 時点 集計期間:1ヶ月 100位まで の書籍タイトルをターゲットにやってみました

結果

$ bash setup.sh
$ time ./text_mining 

real    0m4.377s
user    0m4.228s
sys     0m0.492s

result_wordcloud.png

散っとるのお。

エピローグ

えー... 便利な世の中になったものです。
幡随院先生、逮捕状です

巡査 なんたら

A:○○くぅ~ん
B:なんスかうっとーしーなーもぉーっ
A:あいつさぁ、もっと簡単に出来るの知らなかったんだよ
B:何がぁ?
A:あんなのさぁ、コード書かなくたってさぁ、

wordcloud · PyPI

wordcloud_cli --text mytext.txt --imagefile wordcloud.png

A:ほらな?出来るでしょ?
B:...出力見てみてよ、ほらぁ
A:何が?
B:全部□じゃん。日本語フォント食わせてないでしょ?
A:...ぐうぅぅぅっ
(A、Bの方にすがりながら退場)

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
2