以前、RMeCabからneologdを使えるようにしました
ただ、別のMacにインストールする際、思ったより参照しにくかったので、その手順を飲みをメモしておくことにしました。
Macターミナルでインストール
#mecabインストール
% xcode-select –install
% cd ~/Downloads
% curl -fsSL "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE" -o mecab-0.996.tar.gz
% tar xf mecab-0.996.tar.gz
% cd mecab-0.996
% ./configure –with-charset=utf8
% make
% sudo make install
#brewインストール
cd
% /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install.sh)"
#Next steps:
#- Run these two commands in your terminal to add Homebrew to your PATH:
#上記メッセージに従い以下実行
% echo 'eval "$(/opt/homebrew/bin/brew shellenv)"' >> /Users/hiro_ogawa/.zprofile
% eval "$(/opt/homebrew/bin/brew shellenv)"
#brewのバージョン確認
% brew -v
#動作に必要なパッケージ「xz」インストール
% brew install xz
#neologd辞書のクローン作成
% git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
#neologd辞書インストール
% cd
% ./mecab-ipadic-neologd/bin/install-mecab-ipadic-neologd -n -a
#neologd辞書を指定してmecab実行
% mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
両面宿儺と肉体を共有することとなった虎杖悠仁は、最強の呪術師である五条悟の案内で、対呪い専門機関である「東京都立呪術高等専門学校」へと編入
両面宿儺 名詞,固有名詞,人名,一般,*,*,両面宿儺,リョウメンスクナ,リョーメンスクナ
と 助詞,並立助詞,*,*,*,*,と,ト,ト
肉体 名詞,一般,*,*,*,*,肉体,ニクタイ,ニクタイ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
共有 名詞,サ変接続,*,*,*,*,共有,キョウユウ,キョーユー
する 動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
両面宿儺と
#(扱いやすいと考え)neologd辞書を標準辞書ディレクトリにコピー
% cd /Users/user_name/mecab-ipadic-neologd/build/mecab-ipadic-2.7.0-20070801-neologd-20200910/
% sudo cp -f mecab-user-dict-seed.20200910.csv /usr/local/lib/mecab/dic/ipadic/
#コピー先確認
% cd /usr/local/lib/mecab/dic/ipadic/
#RMeCabにneologdにインストール
% cd /usr/local/lib/mecab/dic/ipadic/
% sudo /usr/local/libexec/mecab/mecab-dict-index \
-d /usr/local/lib/mecab/dic/ipadic \
-u mecab-user-dict-seed.20200910.csv.dic \
-f utf-8 \
-t utf-8 mecab-user-dict-seed.20200910.csv
Rで試す
input <- "両面宿儺と虎杖悠仁"
library(RMeCab)
RMeCabC(input, dic = "//usr/local/lib/mecab/dic/ipadic/mecab-user-dict-seed.20200910.csv.dic")
[[1]]
名詞
"両面宿儺"
[[2]]
助詞
"と"
[[3]]
名詞
"虎杖悠仁"