LoginSignup
1
0

More than 3 years have passed since last update.

CentOS6.10に「mecab」「mecab-ipadic」「mecab-ipadic-neologd」をインストールする。

Last updated at Posted at 2019-05-31

形態素解析エンジン「mecab」と辞書ファイルの「mecab-ipadic」「mecab-ipadic-neologd」をインストールします。
windowsだと「mecab-ipadic-neologd」のインストールが非常に難しいのでvagrantでcentos6を建ててそこにインストールします。

環境

  • ホストOS : windows10 home
  • ゲストOS : centos6.10
    • vagrant 2.2.4
    • VirtualBox 6.0.2
$ cat /etc/redhat-release
CentOS release 6.10 (Final)

「mecab-ipadic-neologd」インストール時の空きメモリ領域は5GB以上が推奨されているので少し多めにメモリを割り当てておきます。
割り当てが4GB( vb.customize ["modifyvm", :id, "--memory", "4096"] )でもインストールの成功は確認しています。

VagrantFile
Vagrant.configure("2") do |config|
  config.vm.box = "centos/6"
  config.vm.provider "virtualbox" do |vb|
    vb.customize ["modifyvm", :id, "--memory", "8192"]
  end
end

vagrantにSSHでログインして必要なパッケージをインストール

$ vagrant up
$ vagrant ssh //パスワードを要求された場合は「vagrant」をパスワードとして入力
$ sudo su
$ cd ~

以下すべてroot権限での操作を想定しています。

「mecab-ipadic-neologd」インストール時に必要なパッケージをインストールします。
「mecab-ipadic-neologd」が必要でない場合はこれらのパッケージは不要です。

$ yum install -y gcc-c++ libiconv patch git 

mecabをインストール

ソースからビルドする方法もありますが地獄を見れるのでyumからインストールしましょう
Groonga(全文検索エンジン)のリポジトリから提供されています。

$ rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
$ yum makecache
$ yum -y install mecab

//mecab -vでバージョンが表示されればインストール成功です。
$ mecab -v
mecab of 0.996

mecab-ipadicをインストール

mecabの動作には辞書ファイルが必要なので次に「mecab-ipadic」をインストールします。

$ yum -y install mecab-ipadic

「mecab」「mecab-ipadic」が正しくインストールされていればmecabを使えるようになるので動作確認してみます。

$ mecab // これで入力待ち状態になるので↓を入力
8月3日に放送された「中居正広の金曜日のスマイルたちへ」(TBS系)で、1日たった5分でぽっこりおなかを解消するというダイエット方法を紹介。キンタロー。のダイエットにも密着。

以下のように表示されれば「mecab」「mecab-ipadic」のインストール成功です。

8       名詞,数,*,*,*,*,*
月      名詞,一般,*,*,*,*,月,ツキ,ツキ
3       名詞,数,*,*,*,*,*
日      名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
放送    名詞,サ変接続,*,*,*,*,放送,ホウソウ,ホーソー
さ      動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ
れ      動詞,接尾,*,*,一段,連用形,れる,レ,レ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
「      記号,括弧開,*,*,*,*,「,「,「
中居    名詞,固有名詞,人名,姓,*,*,中居,ナカイ,ナカイ
正広    名詞,固有名詞,人名,名,*,*,正広,マサヒロ,マサヒロ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
金曜日  名詞,副詞可能,*,*,*,*,金曜日,キンヨウビ,キンヨービ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
スマイル        名詞,一般,*,*,*,*,スマイル,スマイル,スマイル
たち    名詞,接尾,一般,*,*,*,たち,タチ,タチ
へ      助詞,格助詞,一般,*,*,*,へ,ヘ,エ
」(     名詞,サ変接続,*,*,*,*,*
TBS     名詞,一般,*,*,*,*,*
系      名詞,接尾,一般,*,*,*,系,ケイ,ケイ
)       名詞,サ変接続,*,*,*,*,*
で      助詞,格助詞,一般,*,*,*,で,デ,デ
、      記号,読点,*,*,*,*,、,、,、
1       名詞,数,*,*,*,*,*
日      名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ
たっ    動詞,自立,*,*,五段・タ行,連用タ接続,たつ,タッ,タッ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
5       名詞,数,*,*,*,*,*
分      名詞,接尾,助数詞,*,*,*,分,フン,フン
で      助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
ぽ      形容詞,接尾,*,*,形容詞・アウオ段,ガル接続,ぽい,ポ,ポ
っ      動詞,非自立,*,*,五段・カ行促音便,連用タ接続,く,ッ,ッ
こり    動詞,自立,*,*,一段,連用形,こりる,コリ,コリ
おなか  名詞,一般,*,*,*,*,おなか,オナカ,オナカ
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
解消    名詞,サ変接続,*,*,*,*,解消,カイショウ,カイショー
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
という  助詞,格助詞,連語,*,*,*,という,トイウ,トユウ
ダイエット      名詞,サ変接続,*,*,*,*,ダイエット,ダイエット,ダイエット
方法    名詞,一般,*,*,*,*,方法,ホウホウ,ホーホー
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
紹介    名詞,サ変接続,*,*,*,*,紹介,ショウカイ,ショーカイ
。      記号,句点,*,*,*,*,。,。,。
キンタロー      名詞,一般,*,*,*,*,*
。      記号,句点,*,*,*,*,。,。,。
の      助詞,連体化,*,*,*,*,の,ノ,ノ
ダイエット      名詞,サ変接続,*,*,*,*,ダイエット,ダイエット,ダイエット
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
も      助詞,係助詞,*,*,*,*,も,モ,モ
密着    名詞,サ変接続,*,*,*,*,密着,ミッチャク,ミッチャク
。      記号,句点,*,*,*,*,。,。,。
EOS

mecab-ipadic-neologdをインストール

「mecab-ipadic」だけでもmecabの使用には問題ありませんが、「中居正広の金曜日のスマイルたちへ」などの新しめの単語に対応するために「mecab-ipadic-neologd」もインストールします。

$ yum -y install mecab-devel make curl xz
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n   //途中インストールするかの確認が入るのでyesを入力

辞書ファイルとして「mecab-ipadic-neologd」を使いたい場合はmecabの-dオプションに「mecab-ipadic-neologd」のパスを渡します。
辞書ファイルを-dで指定しない場合はシステムデフォルトの辞書ファイル(今回は「mecab-ipadic」)が使用されます。

$ mecab -d #{mecab-ipadic-neologdのパス}

このパスは公式の例では

$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/

となっていますが環境によってかなり変わるようなのでfindで検索します。

$ find / -name mecab-ipadic-neologd -type d
/root/mecab-ipadic-neologd   //←こっちはさっきcloneした方
/usr/lib64/mecab/dic/mecab-ipadic-neologd   //←このパスを mecab -d で指定する

見つけたパスを指定してmecabを起動して「mecab-ipadic-neologd」が辞書ファイルとして使用されているか確認します。

$ mecab -d /usr/lib64/mecab/dic/mecab-ipadic-neologd
8月3日に放送された「中居正広の金曜日のスマイルたちへ」(TBS系)で、1日たった5分でぽっこりおなかを解消するというダイエット方法を紹介。キンタロー。のダイエットにも密着。

以下のように表示されれば「mecab-ipadic-neologd」のインストール成功、mecabが「mecab-ipadic-neologd」を辞書として使用しています。
*mecab-ipadic-neologdは毎週2回更新(!)されているのでこの記事を書いたときとは少し違う結果になっているかもしれません。

8月3日  名詞,固有名詞,一般,*,*,*,8月3日,ハチガツミッカ,ハチガツミッカ
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
放送    名詞,サ変接続,*,*,*,*,放送,ホウソウ,ホーソー
さ      動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ
れ      動詞,接尾,*,*,一段,連用形,れる,レ,レ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
「      記号,括弧開,*,*,*,*,「,「,「
中居正広の金曜日のスマイルたちへ        名詞,固有名詞,一般,*,*,*,中居正広の金曜日のスマイルたちへ,ナカイマサヒロノキンヨウビノスマイルタチヘ,ナカイマサヒロノキンヨービノスマイルタチヘ
」(     記号,一般,*,*,*,*,*
TBS     名詞,固有名詞,一般,*,*,*,TBS,ティービーエス,ティービーエス
系      名詞,接尾,一般,*,*,*,系,ケイ,ケイ
)       記号,一般,*,*,*,*,*
で      助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
、      記号,読点,*,*,*,*,、,、,、
1日     名詞,固有名詞,一般,*,*,*,1日,ツイタチ,ツイタチ
たった  副詞,助詞類接続,*,*,*,*,たった,タッタ,タッタ
5分     名詞,固有名詞,一般,*,*,*,5分,ゴフン,ゴフン
で      助詞,格助詞,一般,*,*,*,で,デ,デ
ぽっこり        副詞,一般,*,*,*,*,ぽっこり,ポッコリ,ポッコリ
おなか  名詞,一般,*,*,*,*,おなか,オナカ,オナカ
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
解消    名詞,サ変接続,*,*,*,*,解消,カイショウ,カイショー
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
という  助詞,格助詞,連語,*,*,*,という,トイウ,トユウ
ダイエット方法  名詞,固有名詞,一般,*,*,*,ダイエット方法,ダイエットホウホウ,ダイエットホウホー
を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
紹介    名詞,サ変接続,*,*,*,*,紹介,ショウカイ,ショーカイ
。      記号,句点,*,*,*,*,。,。,。
キンタロー。    名詞,固有名詞,一般,*,*,*,キンタロー。,キンタロー,キンタロー
の      助詞,連体化,*,*,*,*,の,ノ,ノ
ダイエット      名詞,サ変接続,*,*,*,*,ダイエット,ダイエット,ダイエット
に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
も      助詞,係助詞,*,*,*,*,も,モ,モ
密着    名詞,サ変接続,*,*,*,*,密着,ミッチャク,ミッチャク
。      記号,句点,*,*,*,*,。,。,。
EOS
1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0