Help us understand the problem. What is going on with this article?

MeCabとNEologdのインストール方法(CentOS6/CentOS7)

More than 1 year has passed since last update.

MeCabとは、形態素解析をするためのライブラリです。
NEologdとは、Web上から得た新語に対応しており、毎週更新されるMeCab用のシステム辞書です。
この二つで最新の単語に対応した形態素解析ができます!

「画像での上のコマンド」がデフォルトの辞書、「画像での下のコマンド」がNEologdです。
NEologdでは、「ポケモンGO」「位置情報」などが固有名詞として取得できている。
Group.png

インストール確認環境

・さくらVPSのCentOS6
・AWSEc2のCentOS7

MeCabのインストール

公式サイト
http://taku910.github.io/mecab/

ダウンロードするもの

まずは公式サイトに行き、
・Sourceからmecab-0.996.tar.gz
・IPA 辞書から辞書
の2つをダウンロードします。
スクリーンショット 2016-11-25 4.13.40.png

2つをサーバでインストールする

・mecab-0.996.tar.gz
・mecab-ipadic-2.7.0-20070801.tar.gz
ダウンロードしたファイルを両方解凍する。
コマンドでやる場合は下のコマンドで解凍できます。

tar xvzf mecab-0.996.tar.gz
tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz
mecab-0.996フォルダ
mecab-ipadic-2.7.0-20070801フォルダ

解凍したら2つのフォルダをサーバにアップロードします。
(今回は/usr/local/src/などに保存)
以下のコマンドを実行

mecab-0.996のインストール

cd /usr/local/src/mecab-0.996
sudo ./configure 
sudo make -j4
sudo make install

mecab-ipadic-2.7.0-20070801のインストール

cd /usr/local/src/mecab-ipadic-2.7.0-20070801
sudo ./configure 
sudo make -j4
sudo make install

完了!

下のコマンドで確認してみてください!

mecab -v
mecab of 0.996

実行テスト

echo "ピコ太郎さんはカナブンに角をつけてカブトムシとして売るバイトをしている" | mecab
ピコ   名詞,固有名詞,一般,*,*,*,ピコ,ピコ,ピコ
太郎  名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
さん  名詞,接尾,人名,*,*,*,さん,サン,サン
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
カナブン    名詞,一般,*,*,*,*,カナブン,カナブン,カナブン
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
角 名詞,一般,*,*,*,*,角,カク,カク
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
つけ  動詞,自立,*,*,一段,連用形,つける,ツケ,ツケ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
カブトムシ 名詞,一般,*,*,*,*,カブトムシ,カブトムシ,カブトムシ
として   助詞,格助詞,連語,*,*,*,として,トシテ,トシテ
売る  動詞,自立,*,*,五段・ラ行,基本形,売る,ウル,ウル
バイト   名詞,一般,*,*,*,*,バイト,バイト,バイト
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる  動詞,非自立,*,*,一段,基本形,いる,イル,イル
EOS

NEologdのインストール

neologd-logo-September2016.png

公式GitHub
https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
sudo yum install mecab mecab-devel mecab-ipadic git make curl xz

NEologdのダウンロード

cd /usr/local/src/
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd

NEologdのインストール

./bin/install-mecab-ipadic-neologd -n

・下のエラーが出る場合は、メモリが足りないので、
called after throwing an instance of 'std::bad_alloc
この公式のリファレンスの「空きメモリ領域が足りない場合」の項目を参考に一部のデータをインストールしないようにする。
https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

パスを調べる

echo mecab-config --dicdir"/mecab-ipadic-neologd"
パスが表示される
/usr/local/lib/mecab/dic/mecab-ipadic-neologd

実行テスト

-dのあとに取得したパスを追加して実行するとneologdを参照してくれる。

echo "ピコ太郎さんはカナブンに角をつけてカブトムシとして売るバ イトをしている" | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
ピコ太郎   名詞,固有名詞,人名,一般,,,ピコ太郎,ピコタロウ,ピコタロー
さん  名詞,接尾,人名,,,,さん,サン,サン
は 助詞,係助詞,,,,,は,ハ,ワ
カナブン    名詞,一般,,,,,カナブン,カナブン,カナブン
に 助詞,格助詞,一般,,,,に,ニ,ニ
角 名詞,一般,,,,,角,カク,カク
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
つけ  動詞,自立,,,一段,連用形,つける,ツケ,ツケ
て 助詞,接続助詞,,,,,て,テ,テ
カブトムシ 名詞,一般,,,,,カブトムシ,カブトムシ,カブトムシ
として   助詞,格助詞,連語,,,,として,トシテ,トシテ
売る  動詞,自立,,,五段・ラ行,基本形,売る,ウル,ウル
バイト   名詞,一般,,,,,バイト,バイト,バイト
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
し 動詞,自立,,,サ変・スル,連用形,する,シ,シ
て 助詞,接続助詞,,,,,て,テ,テ
いる  動詞,非自立,,*,一段,基本形,いる,イル,イル
EOS
NEologdの方は、新しい言葉にも対応している。

合わせて使いそうなリンク

CentOS6.7にPython3+OpenCV3(+ffmpeg)を導入する
http://qiita.com/sarumonera/items/ab661b378f5a47c1f282

tomo0
いろいろ書きます!
lifeisstyle
3Dホログラム Phantomのデバイス開発及び、Phantom Cloudの運営
https://lifeis.style
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした