Edited at

Ubuntu環境へCaboChaをインストールし、Pythonで呼び出す。

More than 5 years have passed since last update.


概要

日本語係り受け解析器CaboChaをLinuxMint13(Ubuntu12.04)へインストールし、

Pythonで呼び出せるようにする。


事前作業


MeCab・MeCab辞書のインストール


makeでインストール

下記サイトを参考にさせて貰った。

-> MeCab・MeCab辞書のダウンロードページ

-> MeCab・MeCab辞書のインストール手順ページ


apt-getでインストール

sudo apt-get install mecab libmecab-dev mecab-utils mecab-ipadic-utf8


作業


CaboChaのインストール


makeでインストール

下記サイトを参考にさせて貰った。

-> 忘れがちな記憶へ Ubuntuへyamcha & Cabochaをインストール


apt-getでインストール

下記サイトを参考にさせて貰った。

-> UbuntuにUTF-8版のcabochaを簡単にインストールする方法 - Syo-Takasakiの日記

※注意

・「/etc/apt/source.list」の箇所は「/etc/apt/sources.list」である可能性がある。

・上記サイトの作業完了後、下記コマンドを発行。

sudo apt-get install libcabocha-dev


CaboChaのPythonバインディングのインストール


インストール先フォルダへの移動

CaboChaのインストール先フォルダを探す。

ドライブ内を"CaboCha.py"で検索し、そのファイルがあるフォルダへ移動する。

find / -name CaboCha.py

※注意

・makeでインストールした場合はインストール元フォルダも検索でヒットする。


setup.pyの実行

下記コマンドを発行し、setup.pyを実行する。

sudo python setup.py install


PythonからCaboChaを呼び出す


Cabochaを呼び出す.py

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import CaboCha
c = CaboCha.Parser()
sent = '国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。'
print c.parseToString(sent)

        国境の---D                

長い-D
トンネルを-D
抜けると-D
雪国であった。-----D
夜の-D |
底が-D
白くなった。-----D
信号所に---D
汽車が-D
止まった。
EOS


参考にさせて頂いたWebサイト

-> MeCab: Yet Another Part-of-Speech and Morphological Analyzer

-> cabocha - Yet Another Japanese Dependency Structure Analyzer - Google Project Hosting

-> 忘れがちな記憶へ Ubuntuへyamcha & Cabochaをインストール

-> UbuntuにUTF-8版のcabochaを簡単にインストールする方法 - Syo-Takasakiの日記