初めに
自然言語処理のタスクはますます普及していくと言われています。例えば、行政手続きを処理できるように、CVだけではなく、自然言語処理が大切にします。
今回、私はWordCloudについて紹介させていただきたいと思っています。
コ-ド:
私はGoogleColabでコ-ディングします。
まず、pipでPythonの必要なライブラリをインストールしなければなりません。
以下のイメ-ジの中で、二つのライブラリはmecab(日本語を処理するためのライブラリ)とunidic-lite(日本語の辞書のライブラリ)です。
!pip install mecab-python3
!pip install unidic-lite
!pip install wordcloud
次はそのライブラリを使うために、importにする必要があります
MeCabのライブラリを使用することは簡単だと思いました。以下の通りです。
それから、resultの値を表示することです。
以上のイメ-ジから見ると、長い文章を分割してから、簡単あ言葉として、表示されています。
「最初」という言葉はカタカナの書き方もあるし、漢字の書き方もあるし、言葉のタイプもあります。このツ-ルは良いと思います。
日本語を表示するために、もう一つのライブラリを追加しないといけないです。それは!apt-get -y install fonts-ipafont-gothic
です。
最後は一番大切なステップはWordCloudで言葉を表示することです。以下の通りです。
MatplotlibでWordCloudの変数値を表示します。
まとめ
これはWordCloudの使い方を簡潔に説明する記事です。質問があれば、教えてください。
Ps:私は外国人だから、日本語を勉強しています。日本語のミスがあれば、教えてくれませんか。