言語処理100本ノックで苦戦した話
この記事は100本ノックの回答を書いたものでもなければ、
問題に対する意見を述べるものではありません。
ただただ、初学者である私が環境構築で苦戦した話です。笑
同じ苦労をしている人の助けになればと思い記事を書きました。
参考にする際は自己責任でお願いしますm(_ _)m
言語処理100本ノック
捕捉で私が使っている環境を簡単に記載します。
m1 mac
python3.8(anacondaのJupyterNotebook)
import MeCab でのエラー
始めに立ちはだかった壁はMeCabのimport。
anacondaにMeCabが入っていなかったので、
anacondaの公式にあった以下のコードでインストールしました。
conda install -c conda-forge mecab
もちろん何の問題もなくインストールでき、importするためにコードを実行!
import MeCab
すると
ModuleNotFoundError: No module named 'Mecab'
conda list でインストールされているか確認をすると問題なく入っている。。。
いろいろ調べた結果、pip installで行う必要がありそう。
私の環境がanacondaだけにpip installを使いたくありませんでしたが、背に腹はかえられぬということで
conda uninstall MeCabを行なってから、pip install MeCabを実行
それでようやく、import MeCabで問題なく動きました!
CaboChaの環境構築での苦戦
まず行なったことは、
以下のコードでCRF++をダウンロード、解凍、インストール
FILE_ID = "0B4y35FiV1wh7QVR6VXJ5dWExSTQ"
FILE_NAME = "crfpp.tar.gz"
!wget 'https://docs.google.com/uc?export=download&id=$FILE_ID' -O $FILE_NAME
!tar xvf crfpp.tar.gz
%cd CRF++-0.58
!./configure && make && make install && ldconfig
%cd ..
ここまでは問題なくいけました。
その後、以下のコードでCaboChaのダウンロード、解凍、インストール
FILE_ID = "0B4y35FiV1wh7SDd1Q1dUQkZQaUU"
FILE_NAME = "cabocha-0.69.tar.bz2"
!wget --load-cookies /tmp/cookies.txt "https://docs.google.com/uc?export=download&confirm=$(wget --quiet --save-cookies /tmp/cookies.txt --keep-session-cookies --no-check-certificate 'https://docs.google.com/uc?export=download&id=$FILE_ID' -O- | sed -rn 's/.*confirm=([0-9A-Za-z_]+).*/\1\n/p')&id=$FILE_ID" -O $FILE_NAME && rm -rf /tmp/cookies.txt
!tar -xvf cabocha-0.69.tar.bz2
%cd cabocha-0.69
! ./configure -with-charset=utf-8 && make && make check && make install && ldconfig
%cd ..
ここでエラー文が出ました。泣
clang: error: linker command failed with exit code 1 (use -v to see invocation)
make[2]: *** [cabocha] Error 1
make[1]: *** [all-recursive] Error 1
make: *** [all] Error 2
初学者の私にはよくわからず苦戦。
結局homebrewでインストールすることにして
ターミナル上で以下のコードを実行。
※今回、homebrewのインストール方法は割愛します。
$ brew install cabocha
さっきまでの苦労はなんだったのか!!というくらいあっさりいきました。笑
これでjupyter NotebookでもCaboChaが使えるようになり、
言語処理100本ノックの続きに取り組むことができました!