概要
日本語係り受け解析器CaboChaをLinuxMint13(Ubuntu12.04)へインストールし、
Pythonで呼び出せるようにする。
事前作業
MeCab・MeCab辞書のインストール
makeでインストール
下記サイトを参考にさせて貰った。
-> MeCab・MeCab辞書のダウンロードページ
-> MeCab・MeCab辞書のインストール手順ページ
apt-getでインストール
sudo apt-get install mecab libmecab-dev mecab-utils mecab-ipadic-utf8
作業
CaboChaのインストール
makeでインストール
下記サイトを参考にさせて貰った。
-> 忘れがちな記憶へ Ubuntuへyamcha & Cabochaをインストール
apt-getでインストール
下記サイトを参考にさせて貰った。
-> UbuntuにUTF-8版のcabochaを簡単にインストールする方法 - Syo-Takasakiの日記
※注意
・「/etc/apt/source.list」の箇所は「/etc/apt/sources.list」である可能性がある。
・上記サイトの作業完了後、下記コマンドを発行。
sudo apt-get install libcabocha-dev
CaboChaのPythonバインディングのインストール
インストール先フォルダへの移動
CaboChaのインストール先フォルダを探す。
ドライブ内を"CaboCha.py"で検索し、そのファイルがあるフォルダへ移動する。
find / -name CaboCha.py
※注意
・makeでインストールした場合はインストール元フォルダも検索でヒットする。
setup.pyの実行
下記コマンドを発行し、setup.pyを実行する。
sudo python setup.py install
PythonからCaboChaを呼び出す
# !/usr/bin/env python
# -*- coding: utf-8 -*-
import CaboCha
c = CaboCha.Parser()
sent = '国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。'
print c.parseToString(sent)
国境の---D
長い-D
トンネルを-D
抜けると-D
雪国であった。-----D
夜の-D |
底が-D
白くなった。-----D
信号所に---D
汽車が-D
止まった。
EOS
参考にさせて頂いたWebサイト
-> MeCab: Yet Another Part-of-Speech and Morphological Analyzer
-> cabocha - Yet Another Japanese Dependency Structure Analyzer - Google Project Hosting
-> 忘れがちな記憶へ Ubuntuへyamcha & Cabochaをインストール
-> UbuntuにUTF-8版のcabochaを簡単にインストールする方法 - Syo-Takasakiの日記