目的 Objective
自然言語処理エンジンの GiNZA をPythonに依存せず、また複数台での処理やタンタイムプラットフォームに依存しない仕組みを作ることが目的です。JavaやC#などの環境からもGiNZAを利用できます。
Mecab, Cabocha と比較してセットアップも容易です。
インストール
GiNZA のインストール
pip install -U ginza ja_ginza
pip install -U ginza ja_ginza_electra
ginzaserver のインストール
pip install git+https://github.com/oyahiroki/ginzaserver
ginzaserver の起動
ginzaserver 8888 0
一つ目のパラメータにはサーバーのポート番号、
二つ目のパラメータには利用するエンジンのオプションを指定します。
オプション0 : 実行速度重視モデル
pip install -U ginza ja-ginza
オプション1 : 解析精度重視モデル (メモリ容量16GB以上を推奨)
pip install -U ginza ja-ginza-electra
解析精度重視モデルの場合、手元での測定では2~4倍の処理時間になります。
ginzaserver を利用する
以下のようなHTTP POSTまたはHTTP GETで利用できます。
処理対象テキストのサイズが大きくなる場合はPOSTを利用してください。
POST
curl -X POST -H "Content-Type: application/json" -d "{'text':'今日はいい天気です'}" http://localhost:8888/
GET
curl http://127.0.0.1:8080/?text=%E3%81%93%E3%82%8C%E3%81%AF%E3%83%86%E3%82%B9%E3%83%88%E3%81%A7%E3%81%99%E3%80%82
結果
GiNZAを直接Pythonで実行したときと同じJSONが返ります。
Ginza をJavaから利用する
Java 向けには専用のJSONパーサーを準備中です。
ソースコード
中身がどんなものか心配な方はソースコードをご確認ください
以上
参考になるかもしれない記事