初めまして。
水色桜(みずいろさくら)と申します。
この記事群では自然言語処理ライブラリGiNZAの使い方について簡単に説明していこうと思います。
最終的には感情分析プログラムの作成まで書いていきたいと考えています。
この記事はGiNZAの簡単な説明と、導入方法についてです。
まず、そもそも自然言語とは何?とお思いの方もいらっしゃるかと思います。
「自然言語」とは「日本語」や「英語」のような普段人間が使っている言葉です。
単に「言語」と言ってしまうとプログラミング言語を含んでいるみたいになってしまうので、対比の意味もあって、「自然言語」と言います。
自然言語処理というのは普段人間が使う言葉をうまい具合に処理して、会話をしてみたり、文章に含まれている感情を検出したりすることを目指しています。
たくさんの研究者さんの努力のおかけで、自然言語処理をするための道具、ライブラリにはいくつか種類があります。有名どころだとMecabなどが挙げられます。今回説明するGiNZAはその中でも導入(パソコンに入れる)のが簡単で、高精度な解析ができる優れものです。GiNZAを開発されたリクルートさんと国立国語研究所さんには感謝してもしきれません。
GiNZAはspaCyというライブラリを元に作られています。spaCyはExplosion社さんが提供している自然言語処理ライブラリで、アメリカなどでは人気のあるライブラリです。製品利用を念頭に尽きられているためとっても使い勝手が良いのですが、なんと2019年までは日本語には対応していませんでした。そこでリクルートさんと国立国語研究所さんが日本語の学習済みモデルを作成し、さらに導入を超簡略化までしてくれました❕
GiNZAの導入はコマンドプロンプトなどで
cd [pythonのあるディレクトリ]
pip install ginza
と入力するだけです。本当に簡単!!
今回はここまでにしたいと思います。
次回はGiNZAできることをソースコードを示しながら簡単に説明するつもりです。
では、ばいにゃん~。
参考にさせていただいた記事
https://qiita.com/poyo46/items/7a4965455a8a2b2d2971