LoginSignup
1
2

More than 1 year has passed since last update.

CUIでのテキストマイニングって簡単になったなぁと感嘆

Last updated at Posted at 2021-09-05

プロローグ

1年間に発売されたライトノベルのタイトルを、AIテキストマイニングで分析してみた|岡田勘一[編集者・ライター]|note

が気になった。

この方は
AIテキストマイニング by ユーザーローカル
というwebサービスを利用しているが、
やっぱCUIでやりたいじゃないっすか。ね。

参考にしたもの

【コード公開】【Python】テキストマイニングしてみた〜ジョブズのスピーチでWordCloudを作ろう | Analytics Board | python特化のプログラミングサイト

source

https://github.com/tknr/text_mining

本体はこんなに短い。

#!/usr/bin/python
# coding: utf-8
from wordcloud import WordCloud

text_file = open("src.txt")
bindata = text_file.read()
txt = bindata

wordcloud = WordCloud(background_color="white",
    font_path="HackGenNerd_v2.5.1/HackGenNerd-Regular.ttf",
    width=800,height=600).generate(txt)


wordcloud.to_file("./result_wordcloud.png")

今回は
小説・文学通販ランキング - honto
2021/09/05 時点 集計期間:1ヶ月 100位まで の書籍タイトルをターゲットにやってみました

結果

$ bash setup.sh
$ time ./text_mining 

real    0m4.377s
user    0m4.228s
sys     0m0.492s

result_wordcloud.png

散っとるのお。

エピローグ

えー... 便利な世の中になったものです。
幡随院先生、逮捕状です

巡査 なんたら

A:○○くぅ~ん
B:なんスかうっとーしーなーもぉーっ
A:あいつさぁ、もっと簡単に出来るの知らなかったんだよ
B:何がぁ?
A:あんなのさぁ、コード書かなくたってさぁ、

wordcloud · PyPI

wordcloud_cli --text mytext.txt --imagefile wordcloud.png

A:ほらな?出来るでしょ?
B:...出力見てみてよ、ほらぁ
A:何が?
B:全部□じゃん。日本語フォント食わせてないでしょ?
A:...ぐうぅぅぅっ
(A、Bの方にすがりながら退場)

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2