まえがき
以前も触れた書籍「すぐに使える!業務で実践できる! PythonによるAI・機械学習・深層学習アプリのつくり方 TensorFlow2対応」でMeCabが登場したので、早速インストールしようとしてみました。しかし、有名かつ古参のソフトウェアということで、ネット上の情報の時間軸が散らばっていて、結構導入に手こずりました。
同じようにAnaconda仮想環境でconda installを使いMeCabを導入したい方の参考になれば、ということで残しておきます。
実行環境
- Anaconda3(64bit)
- Python3.8
導入方法
まずはこちらのサイトを参考にしつつMeCabのインストールと、Path通しを行ってください。サイト中にもありますが、デフォルトのshift_jisではなくutf-8でインストールしないと後でエラーを吐くのでご注意ください。
次にconda installを行いますが、自分がデフォルトとconda-forgeのチャンネルで探す限り、"mecab-python-windows"も"mecab-python3"も"mecab"も見つけることができませんでした。
そこでAnacondaの公式サイトで検索をかけたところ、このパッケージがでてきました。こちらに記載してあるコマンドの
conda install -c mzh mecab-python3
でインストールしたところ、以下のコードが実行できました。
import MeCab
# MeCabオブジェクトの生成
tagger = MeCab.Tagger()
# 形態素解析
result = tagger.parse("紹介されているパッケージや環境がばらついていて、非常に苦労しました。")
print(result)
紹介 名詞,サ変接続,*,*,*,*,紹介,ショウカイ,ショーカイ
さ 動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ
れ 動詞,接尾,*,*,一段,連用形,れる,レ,レ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる 動詞,非自立,*,*,一段,基本形,いる,イル,イル
パッケージ 名詞,一般,*,*,*,*,パッケージ,パッケージ,パッケージ
や 助詞,並立助詞,*,*,*,*,や,ヤ,ヤ
環境 名詞,一般,*,*,*,*,環境,カンキョウ,カンキョー
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
ばらつい 動詞,自立,*,*,五段・カ行イ音便,連用タ接続,ばらつく,バラツイ,バラツイ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
い 動詞,非自立,*,*,一段,連用形,いる,イ,イ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
、 記号,読点,*,*,*,*,、,、,、
非常 名詞,形容動詞語幹,*,*,*,*,非常,ヒジョウ,ヒジョー
に 助詞,副詞化,*,*,*,*,に,ニ,ニ
苦労 名詞,サ変接続,*,*,*,*,苦労,クロウ,クロー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
まし 助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。 記号,句点,*,*,*,*,。,。,。
相変わらずものすごい精度で驚くばかりです。
あとがき
書籍の方には「MeCabはWindowsだとセットアップが大変なので、VirtualBox上で仮想環境を作って導入してね」とありましたが、確かにそこそこ大変でした。
集合知に感謝。