#0.環境等
Google Colaboratoryへのインストール記録。
インストールしたのは、
- JUMAN7.01
- KNP 4.19
- pyknp(バージョン不明、2019/06/16時点でインストール)
#1.JUMAN
# JUMAN
# 参考 https://teratail.com/questions/186997
!wget "http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/juman/juman-7.01.tar.bz2"
!bzip2 -dc juman-7.01.tar.bz2 | tar xvf -
%cd juman-7.01/
!./configure
!make
!make install
%cd ..
!ldconfig
#2.KNP
- 所要時間30数分。
- knp-4.12以降はCRF++が同梱されるようになったので別途インストールする必要はなくなりました
# KNPのインストール
# https://www.utali.io/entry/2016/10/20/202744
# http://nlp.ist.i.kyoto-u.ac.jp/index.php?KNP%2F%E3%82%A4%E3%83%B3%E3%82%B9%E3%83%88%E3%83%BC%E3%83%AB%E6%96%B9%E6%B3%95
! wget http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/knp-4.19.tar.bz2
! tar jxvf knp-4.19.tar.bz2
% cd knp-4.19
!./configure
!make
!make install
#3.pyKNP
- Pythonバインド
- 本当に必要なのかは不明。理由は、上記1,2をインストールした段階で、下記4の結果を得られたため。しかし、念のためインストールしておく。
! pip install pyknp
#4.インストール確認
次のサイトより引用
http://cr.fvcrc.i.nagoya-u.ac.jp/~sasano/knp/install.html
! echo "麻生太郎はコーヒーを買って飲んだ。" | juman | knp -anaphora
> (解析結果)
麻生─────┐ <体言><EID:0>
太郎は─────┐ <体言><NE:PERSON:麻生太郎><Wikipediaエントリ:麻生太郎><EID:1>
コーヒーを─────┤ <体言><EID:2>
買って─────┤ <用言:動><EID:3><項構造:ガ/O/麻生太郎/1;ヲ/O/コーヒー/2>
飲んだ。 <用言:動><EID:4><項構造:ガ/N/麻生太郎/1;ヲ/C/コーヒー/2>
EOS