#はじめに
khcoderというすごく使いやすいテキストマイニングのフリーウェアがあるのですが、Linuxではソースコードから起動しなくてはならなく、いろいろな手順が必要なので書きました。
#手順
##perlのインストールとkhcoderのダウンロード
perlのインストール
sudo apt-get install perl
git clone でkhcoderをクローンする
git clone https://github.com/ko-ichi-h/khcoder.git
khcoderを動かすのに必要なperlのモジュールをインストールします。
sudo perl -MCPAN -e shell
install Jcode
install Tk
install DBI
install DBD::CSV
install File::BOM
install Lingua::JA::Regular::Unicode
install Excel::Writer::XLSX
install DBD::mysql
install YAML
install Spreadsheet::ParseExcel::FmtJapan
install Spreadsheet::ParseXLSX
install Statistics::ChisqIndep
install Unicode::Escape
install Statistics::Lite
install Algorithm::NaiveBayes
##khcoderに必要なソフトウェアの準備
###mysqlのインストール
khcoderは5.6以前での動作を想定しているので仕様変更後の5.7ではエラーが出るようです。
よってmysql5.6をインストールします。
sudo add-apt-repository 'deb http://archive.ubuntu.com/ubuntu trusty universe'
sudo apt-get update
sudo apt-get install mysql-server-5.6
sudo apt-get install mysql-client-5.6
#エラーが出るならこれを実行してもう一回
sudo rm /var/lib/mysql/debian-5.7.flag
###mecabのインストール
http://taku910.github.io/mecab/#download
ここからmecabのtar.gzをダウンロード
cd ~/"ダウンロードフォルダ"
tar zxvf mecab-0.996.tar.gz
cd mecab-0.996/
./configure --with-charset=utf8
sudo make install
辞書もインストール
wget -O mecab-ipadic-2.7.0-20070801.tar.gz 'https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM'
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
sudo make install
###Rのインストール
sudo nano /etc/apt/sources.list
deb https://cran.ism.ac.jp/bin/linux/ubuntu xenial/ #環境によって書き換える 詳しくは参考サイトを参照
gpg --keyserver keyserver.ubuntu.com --recv-key E084DAB9
gpg -a --export E084DAB9 | sudo apt-key add -
sudo apt-get update
sudo apt-get install r-base
sudo apt-get install r-base-dev
#Rパッケージの依存関係?エラーが出るようならインストール
sudo apt-get install libcurl4-openssl-dev
Rパッケージをインストール
R
install.packages('devtools')
library(devtools)
slam_url <- "https://cran.r-project.org/src/contrib/Archive/slam/slam_0.1-37.tar.gz"
install_url(slam_url)
install.packages("RColorBrewer")
install.packages("wordcloud")
install.packages("amap")
install.packages("ggdendro")
install.packages("maptools")
install.packages("ade4")
install.packages("scatterplot3d")
install.packages("intergraph")
git cloneしたフォルダに移動してkhcoderを起動する(必要ない可能性もあり)。
cd "git cloneした場所"/khcoder
perl kh_coder.pl
configファイルにmysqlのユーザー名とパスワードを書く。
今回はめんどくさいのでrootにしてしまう。
cd config
nano coder.ini
nanoで
sql_username root
sql_password mysqlインストール時に設定したパスワード
とする。
##参考にしたサイト様
https://github.com/ko-ichi-h/khcoder
https://askubuntu.com/questions/762384/install-mysql-5-6-on-ubuntu-16-04
https://qiita.com/pugiemonn/items/e4e0c5c620566c45c3f0
http://st-hakky.hatenablog.com/entry/2017/10/04/164959
https://sourceforge.net/p/khc/discussion/222396/thread/d2e1c19b/
https://qiita.com/yossun/items/0423bf6775de8e6305f3
http://chasen-legacy.osdn.jp/
#最後に
いろいろなエラーを乗り越えてやっと動かせるようになりましたが、もしかしたら書き間違えていることや書き忘れていることがあるかもしれません。また、環境が変わって別のものが必要になるかもしれません。そうなったら、エラーから必要なものをインストールして、できなければそれをインストールするための手段を探してみてください。
何かあればコメントしていただければできる限り改善していきたいと思います。よろしくお願いします。