CaboChaとは?
日本語係り受け解析器。自然言語処理に使う。
基本的なinstall方法
公式サイトにあるとおり、基本的にはソースをダウンロードしてきて以下のコマンドで入るはず(だった)。事前にCRF++やMecabのinstallも必要。
./configure
make
make check
sudo make install
pythonで使いたい方はさらにpythonフォルダで以下をする事になります。
python setup.py install
つまづきそうな部分
ソースのURL
公式のダウンロードリンクはGoogleDriveの公開フォルダに飛んでるので、CentOSとかに入れるときにwgetに指定するURLをどうすればいいのか一瞬わかりませんでした。
とりあえず私は以下でdownloadできました。(CRF++だけgooglecodeに認証かかってた...)
iconv conversion failed. skip this entry....
makeしたときに以下のようなwarning(?)がずらずらと出てくるかと思います。
iconv conversion failed. skip this entry....
encodeの問題らしいです。./configure のときに オプションに以下をします。
./configure --with-charset=utf8 --enable-utf8-only
ライブラリの読み込みエラー
makeの時にこんなかんじのエラーが出る
error while loading shared libraries: libcrfpp.so.0: cannot open shared object file: No such file or directory
環境にもよると思いますが、依存関係情報を追加すれば大丈夫です。
echo "/usr/local/lib" >> /etc/ld.so.conf.d/lib.conf
ldconfig
(python3) setup.pyがエラー
string.split (cmd1(str))
がなんとかって怒られると思います。
cabochaのコードがpython3に対応してないために起こるエラーです。
親切な方がpatchファイルを書いてくださっているので、そちらに合わせてソースを修正してください。
とりあえずこんな感じで。また何かあったら付け足すかも。