0.環境等
Google Colaboratoryへのインストール記録。
インストールしたのは、
- JUMAN7.01
- KNP 4.19
- pyknp(バージョン不明、2019/06/16時点でインストール)
1.JUMAN
# JUMAN
# 参考 https://teratail.com/questions/186997
!wget "http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-7.01.tar.bz2"
!bzip2 -dc juman-7.01.tar.bz2 | tar xvf -
%cd juman-7.01/
!./configure
!make
!make install
%cd ..
!ldconfig
2.KNP
- 所要時間30数分。
- knp-4.12以降はCRF++が同梱されるようになったので別途インストールする必要はなくなりました
# KNPのインストール
# https://www.utali.io/entry/2016/10/20/202744
# http://nlp.ist.i.kyoto-u.ac.jp/index.php?KNP%2F%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB%E6%96%B9%E6%B3%95
! wget http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.19.tar.bz2
! tar jxvf knp-4.19.tar.bz2
% cd knp-4.19
!./configure
!make
!make install
3.pyKNP
- Pythonバインド
- 本当に必要なのかは不明。理由は、上記1,2をインストールした段階で、下記4の結果を得られたため。しかし、念のためインストールしておく。
! pip install pyknp
4.インストール確認
次のサイトより引用
http://cr.fvcrc.i.nagoya-u.ac.jp/~sasano/knp/install.html
! echo "麻生太郎はコーヒーを買って飲んだ。" | juman | knp -anaphora
(解析結果)
麻生─────┐ <体言>EID:0
太郎は─────┐ <体言>NE:PERSON:麻生太郎EID:1
コーヒーを─────┤ <体言>EID:2
買って─────┤ <用言:動>EID:3<項構造:ガ/O/麻生太郎/1;ヲ/O/コーヒー/2>
飲んだ。 <用言:動>EID:4<項構造:ガ/N/麻生太郎/1;ヲ/C/コーヒー/2>
EOS